logo of antgroup

蚂蚁金服蚂蚁集团-大模型 AI 工程师/技术专家-上海/杭州

社招全职3年以上技术类-算法地点:上海 | 杭州状态:招聘

任职要求


1.教育背景: 计算机科学、软件工程、人工智能或相关专业的本科及以上学历。
2.编程能力: 具备出色的工程实现能力,至少精通 PythonC++ 其中一种编程语言,并有扎实的数据结构算法基础。
3.框架经验: 熟悉至少一种主流深度学习框架(如 PyTorchTensorFlow)的内部机制,对 PyTorch 有深入理解者优先。
4.大模型经验: 熟悉大模型训练或推理技术,有使用 Megatron-LM/Transformer-Engine , DeepSpeed 等大规模训练框架的实践经验。
5.系统能力: 具备良好的系统性思维和问题解决能力,能够从软硬件结合的视角分析和解决复杂的性能问题。
6.加分项:
-熟悉 …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.我们正在寻找充满激情和经验丰富的大模型 AI 工程师/技术专家,加入我们行业领先的基础模型团队(Ling Team)。您将从基础设施的视角出发,深入参与大语言模型(LLM)的研发过程,与算法研究员紧密合作,共同负责并推动算法与工程的协同设计(Co-design)及优化。
在这个职位上,您将有机会解决大规模分布式训练和推理中的前沿挑战,通过极致的性能优化,将硬件潜力发挥到极限,为我们基础模型的迭代和业务落地提供坚实的算力基座和工程保障。
2.岗位职责:
你将从基础设施的视角,参与到新一代基座模型研发中,包括但不限于以下工作:
-算法与工程协同设计: 参与scaling law 和 新模型架构的迭代设计,提供专家级工程实现方案,确保新模型架构的可实现性、高效性及可扩展性。
-训练与推理系统优化:基于特定模型架构,系统性分析并优化训练/推理框架性能,识别并解决大规模集群环境下的关键性能瓶颈。
-高性能并行与算子优化:研发高效精细的分布式并行策略(如张量、流水线、序列并行等),并针对核心算子进行定制化优化,充分释放硬件计算潜能。
-前沿技术探索与落地: 跟踪并引入业界最新的 AI 基础设施技术,包括但不限于编译优化、新型硬件架构等,并将其应用于实际的大模型研发中。
包括英文材料
学历+
Python+
C+++
数据结构+
算法+
深度学习+
PyTorch+
TensorFlow+
大模型+
Megatron+
Transformer Engine+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能集团

我们的愿景:【数据驱动智能,观测重构治理】 在专有云(Apsara Stack)这一数字化转型的技术深水区,我们正在打造 AI 驱动的可观测性中枢。通过高性能引擎与 LLM(大语言模型)的协同,我们致力于在海量、异构的专有云环境中,为政企客户提供秒级故障定位体验。 在这里,你处理的是关乎国计民生的核心基础设施,你定义的每一行代码都在构建一个**“可预测、自修复”**的数字底座。

更新于 2026-03-24北京|杭州|上海
logo of bytedance
社招A116723

团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok直播研发团队,旨在实现TikTok直播业务的研发工作,搭建及维护业界领先的产品。 加入我们,你能接触到包括:社交互动、营收活动、主播生态、消费订阅、游戏直播、公会&运营平台等核心业务场景,支持产品在全球赛道上高速发展; 也能接触到包括服务架构、大模型算法、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。 在这里,团队专业且纯粹,合作氛围平等且轻松。 目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 1、参与直播容量管理、成本管理和预算优化工作; 2、深入理解直播业务,理解产品视角下完整的营收和成本的逻辑,熟悉公司财务和经营分析体系; 3、深入理解国际化技术体系,设计或指导成本相关的优化工作; 4、构建数据驱动的成本优化模式,应用AI提升效率。

更新于 2025-03-03北京
logo of aliyun
社招3年以上云智能集团

1. 根据阿里云AI战略发展方向,结合人工智能技术演进与行业变革趋势,前瞻性地识别并开拓重点目标客户在大模型、智能计算等领域的业务机会; 2. 能够深入调研客户业务场景,敏锐捕捉行业中的应用痛点与创新潜力,结合阿里云产品及技术优势,促进客户需求与云产品的有效结合,提供立体、专业的咨询及服务,帮助客户成功,并沉淀行业解决方案; 3. 与客户或合作伙伴进行重点项目对接,能向客户高层解析阿里云AI优势,向业务高管呈现具有说服力的AI投资回报率(ROI)分析,加速商机转化; 4. 善于整合技术、生态与商业资源,攻克AI落地中的关键挑战,与客户技术决策层及生态合作伙伴建立深度信任关系,沉淀可复用的行业解决方案与最佳实践,为阿里云AI战略的长期发展储备关键客户与技术资产。

更新于 2025-12-26杭州|上海
logo of xiaohongshu
社招引擎

DirectLLM是小红书内部面向各业务场景建设的大模型API服务产品,通过标准化API接口提供LLM/MLLM等大模型推理服务,致力于为AI应用开发者提供品类丰富、数量众多的模型选择,并通过API接口为其提供开箱即用、能力卓越、成本经济的模型服务,各领域模型的能力均可通过统一的API和SDK来实现被不同业务系统集成。 工作职责: 1、参与/负责大模型推理服务平台(MaaS)的架构设计、系统研发、产品研发等工作; 2、深入参与面向大模型场景的请求调度、异构资源调度、引擎优化等核心工作,实现千亿级Token并行推理平台; 3、为内部产品线提供解决方案,协助公司内用户解决大模型应用过程中业务在平台上的使用问题。

北京|上海|深圳