米哈游【提前批】大模型推理系统工程师
任职要求
1、本科及以上学历,计算机、软件工程、人工智能等相关专业优先 2、熟练掌握Linux环境下的C/C++与Python语言 3、精通以下至少一项的背景知识或经验:推理引擎和框架、GPU资源调度、高性能计算与通信、GPU监控和性能分析、模型量化、编译优化等 4、具有独立解决问题的能力,良好的团队合作精神 5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱精神 6、有良好的文档习惯,及时按要求撰写更新工作流程及技术文档 加分项 - 深入研究过至少一种推理框架(vllm/sglang等)的底层架构和原理,理解page attention等相关核心技术 - 理解GPU硬件架构,深入理解GPU软件栈,具备GPU性能分析和开发的经验 - 完整参与过模型压缩、量化后的精度对齐和上线流程 - 有LLM/推荐广告/搜索等在线和离线推理系统架构经验 - 有硕士/博士阶段的计算机系统方向研究背景,或在国际顶级系统会议上(OSDI/SOSP/SIGCOMM/ASPLOS/NSDI等)发表过论文者优先
工作职责
1、负责公司各AI推理场景(LLM/多模态/视频等)的推理系统研发和性能优化、资源调度、可观测性搭建、日常维护等工作 2、与算法团队深度合作,进行算法与系统的联合设计与优化(如模型量化、kvcache量化、投机采样等) 3、保持关注行业前沿技术,且有能力和热情开展创新研究
1、探索大模型及Agent技术在游戏领域的前沿应用,包括不限于智能NPC、AI交互叙事、AIGC游戏内容生成管线研发; 2、优化和提升游戏场景下的模型效果:SFT/RLHF训练策略、Reward Model、记忆系统、Agent架构; 3、预研大模型驱动的AI Native游戏玩法、提升游戏体验、确保内容可控性和实时推理性能等。
1、专研训练框架,快速定位训练中出现的问题,分析训练过程中的模型表现,跟infra team合作来保证训练策略的正确性 2、紧跟领域前沿技术,研究新型LLM模型架构,提升训练或推理的计算效率和模型性能 3、研究不同架构、数据、目标函数和优化方法等各个算法方面的scaling law,总结出高效稳定的预训练策略 4、拓展模型在长文本理解和生成的能力
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 你的挑战: 攻克LLM全链路训练难题:主导大模型训练,优化模型Scaling Law,结合应用需求突破分布式性能瓶颈,基于RL增强模型推理能力,打造电商领域最懂用户需求的超级大脑(含多模态VLM研发)。 为什么选择淘天? 1.坐拥电商领域最大规模场景:每天处理数亿次用户交互,覆盖搜索/推荐/广告/客服/营销全链路,你将直接面对全球最复杂的电商需求场景。 2.定义未来购物标准:你研发的模型将服务数亿消费者,结合大语言和多模态模型能力满足用户偏好,影响海量商家经营决策。 3.顶级科研配置:超大规模GPU集群支持大规模参数模型训练,自研分布式框架实现训练推理效率大幅提升,顶级会议发表,前沿技术成果即时输血。 加入我们,你将获得: 1.与NLP/多模态领域顶尖团队共创,解锁大模型在商品理解、智能创作、消费决策、购物对话等场景的无限可能。 2.弹性化的技术路线选择权,既可在大模型基础技术方面突破能力上限,也可深入应用层打造现象级AI产品。 3.打通产学研用全链路:支持技术成果转化顶会论文和专利+百万级ai native用户产品。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。