logo of antgroup

蚂蚁金服蚂蚁集团-大模型 AI 工程师/技术专家-上海/杭州

社招全职3年以上技术类-算法地点:上海 | 杭州状态:招聘

任职要求


1.教育背景: 计算机科学、软件工程、人工智能或相关专业的本科及以上学历。
2.编程能力: 具备出色的工程实现能力,至少精通 PythonC++ 其中一种编程语言,并有扎实的数据结构算法基础。
3.框架经验: 熟悉至少一种主流深度学习框架(如 PyTorchTensorFlow)的内部机制,对 PyTorch 有深入理解者优先。
4.大模型经验: 熟悉大模型训练或推理技术,有使用 Megatron-LM/Transformer-Engine , DeepSpeed 等大规模训练框架的实践经验。
5.系统能力: 具备良好的系统性思维和问题解决能力,能够从软硬件结合的视角分析和解决复杂的性能问题。
6.加分项:
-熟悉 …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.我们正在寻找充满激情和经验丰富的大模型 AI 工程师/技术专家,加入我们行业领先的基础模型团队(Ling Team)。您将从基础设施的视角出发,深入参与大语言模型(LLM)的研发过程,与算法研究员紧密合作,共同负责并推动算法与工程的协同设计(Co-design)及优化。
在这个职位上,您将有机会解决大规模分布式训练和推理中的前沿挑战,通过极致的性能优化,将硬件潜力发挥到极限,为我们基础模型的迭代和业务落地提供坚实的算力基座和工程保障。
2.岗位职责:
你将从基础设施的视角,参与到新一代基座模型研发中,包括但不限于以下工作:
-算法与工程协同设计: 参与scaling law 和 新模型架构的迭代设计,提供专家级工程实现方案,确保新模型架构的可实现性、高效性及可扩展性。
-训练与推理系统优化:基于特定模型架构,系统性分析并优化训练/推理框架性能,识别并解决大规模集群环境下的关键性能瓶颈。
-高性能并行与算子优化:研发高效精细的分布式并行策略(如张量、流水线、序列并行等),并针对核心算子进行定制化优化,充分释放硬件计算潜能。
-前沿技术探索与落地: 跟踪并引入业界最新的 AI 基础设施技术,包括但不限于编译优化、新型硬件架构等,并将其应用于实际的大模型研发中。
包括英文材料
学历+
Python+
C+++
数据结构+
算法+
深度学习+
PyTorch+
TensorFlow+
大模型+
Megatron+
Transformer Engine+
还有更多 •••
相关职位

logo of aliyun
社招3年以上云智能集团

1. 根据阿里云AI战略发展方向,结合人工智能技术演进与行业变革趋势,前瞻性地识别并开拓重点目标客户在大模型、智能计算等领域的业务机会; 2. 能够深入调研客户业务场景,敏锐捕捉行业中的应用痛点与创新潜力,结合阿里云产品及技术优势,促进客户需求与云产品的有效结合,提供立体、专业的咨询及服务,帮助客户成功,并沉淀行业解决方案; 3. 与客户或合作伙伴进行重点项目对接,能向客户高层解析阿里云AI优势,向业务高管呈现具有说服力的AI投资回报率(ROI)分析,加速商机转化; 4. 善于整合技术、生态与商业资源,攻克AI落地中的关键挑战,与客户技术决策层及生态合作伙伴建立深度信任关系,沉淀可复用的行业解决方案与最佳实践,为阿里云AI战略的长期发展储备关键客户与技术资产。

更新于 2025-12-26杭州|上海
logo of bytedance
社招A116723

团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok直播研发团队,旨在实现TikTok直播业务的研发工作,搭建及维护业界领先的产品。 加入我们,你能接触到包括:社交互动、营收活动、主播生态、消费订阅、游戏直播、公会&运营平台等核心业务场景,支持产品在全球赛道上高速发展; 也能接触到包括服务架构、大模型算法、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。 在这里,团队专业且纯粹,合作氛围平等且轻松。 目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 1、参与直播容量管理、成本管理和预算优化工作; 2、深入理解直播业务,理解产品视角下完整的营收和成本的逻辑,熟悉公司财务和经营分析体系; 3、深入理解国际化技术体系,设计或指导成本相关的优化工作; 4、构建数据驱动的成本优化模式,应用AI提升效率。

更新于 2025-03-03北京
logo of aliyun
社招1年以上云智能集团

1.需求分析与场景识别: 了解一个或多个领域的业务知识,能够跟客户有效沟通和洞察真实需求,并识别出可以使用人工智能技术的场景 2.技术判断与解决方案: 理解机器学习、深度学习、大模型的基本原理, 能够基于客户的需求,基于云+AI的产品设计出适合的解决方案,具备智能体开发demo的能力, 并可以向客户的业务/技术决策人阐述阿里云产品和解决方案的优势,以影响客户的技术选型决策 3.产品需求反馈与优化:依据市场/客户需求、技术动态,结合技术研判向产研部门反馈大模型应用解决方案及Agent工具等的优化建议,推动技术创新和解决方案的迭代升级,提升产品市场竞争力和市场占有率; 4.市场敏感与扩展复制:挖掘可复制、可规模化、符合市场逻辑的大模型解决方案,通过客户案例的落地对成功实践进行总结归纳完成从0到1;并对内部团队及客户进行知识和项目分享,促进从1到N的复制;

更新于 2025-11-24上海|北京|杭州
logo of bytedance
社招A191470

团队介绍:Data-电商-智能对话团队,致力于打造业界领先的大模型对话系统。团队服务的日活用户超过数亿,应用场景覆盖抖音电商全链路,包括平台客服、平台商服、商家客服、达人客服,以及创新的智能导购等核心业务场景,通过持续的技术创新和优化,成功构建了一套完整的智能对话解决方案,为电商业务带来了显著的效率提升和用户体验改善。 课题介绍: 背景:电商智能客服正逐渐成为业务增长和用户体验优化的重要方向,基于大型语言模型(LLM)的智能客服系统解决电商场景中的核心挑战,由LLM完成一次用户进线的完整接待过程,包括诉求澄清、方案协商、方案执行等阶段,实现电商业务的智能化升级——让用户享受更智能高效的客服服务。 研究方向:本课题聚焦于LLM 后训练与智能客服。构建基于 LLM 的多智能体(Multi-Agent)框架,通过规划、回复、工具三类Agent的协作,实现从问题分析、方案执行到结果反馈的全流程智能客服。核心目标是确保客服对话的准确性、合规性与流畅度,避免模型生成幻觉或违背平台政策。同时,围绕电商客服的复杂任务,构建 Benchmark数据集,优化SOP遵循、多轮交互、用户满意度等指标。此外,研究高效数据利用方法,探索低标注数据条件下的LLM训练,并开发自动生成高质量训练数据的系统,以降低人工标注成本,提高智能客服的服务质量与效率。 1、开发AI驱动的智能客服系统:设计并实现AI对话式客服助手,能够处理电商咨询、投诉、退款、争议解决及物流相关问题,以AI替代传统人工客服; 2、大语言模型(LLM)后训练与高效学习:应用最前沿的LLM训练优化技术,如指令微调、强化学习、持续学习等,在最少标注数据的情况下优化AI客服响应质量;具备大语言模型(LLM)微调、知识蒸馏或强化学习的相关经验,应用于对话式AI场景;深入理解检索增强生成(RAG)、专家混合模型(MoE)、稀疏注意力、强化学习、推理时间优化等技术,以提升AI对话质量; 3、基准测试与训练数据构建:识别具有挑战性的客服交互场景,如政策解读、争议处理、客户投诉、导购推荐等,并构建专门的测试集和训练集; 4、多语言与跨文化客服支持:构建能够适应多语言和不同文化背景的AI模型,确保客服交互的精准翻译和针对不同用户群体的合适响应;精通多语言自然语言处理(NLP)、机器翻译及跨语言对话建模; 5、模型优化与高效部署:研究模型压缩、量化、推理优化等技术,确保AI客服助手在大规模应用场景下具备低延迟、高可靠性的表现。

更新于 2025-05-27上海