米哈游【提前批】AI Native游戏LLM研究员
任职要求
1、2026届应届硕士/博士,计算机/人工智能/数学相关及相关专业; 2、精通Python/PyTorch,具有良好的编程能力和扎实的数学理论基础; 3、有主流开源大模型使用经验,并实践过LLM关键技术栈(SFT、RLHF、DPO、Reasoning、Reward Model、RAG等); 4、关注行业前沿进展(尤其是AI游戏、AI陪伴产品),对技术应用有热情,有自己的想法并乐于挑战,具备问题建模能力; 5、良好的沟通能力,跨团队协作能力,具备出色的规划、执行力,以及优秀的学习能力和自我驱动力。 加分项 1、在NeurIPS/ICML/ICLR/ACL/EMNLP等会议或期刊上发表过LLM、Agent相关论文者优先; 2、有游戏AI相关研究或开发经历(如NPC/AIGC系统)。
工作职责
1、探索大模型及Agent技术在游戏领域的前沿应用,包括不限于智能NPC、AI交互叙事、AIGC游戏内容生成管线研发; 2、优化和提升游戏场景下的模型效果:SFT/RLHF训练策略、Reward Model、记忆系统、Agent架构; 3、预研大模型驱动的AI Native游戏玩法、提升游戏体验、确保内容可控性和实时推理性能等。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 你的挑战: 攻克LLM全链路训练难题:主导大模型训练,优化模型Scaling Law,结合应用需求突破分布式性能瓶颈,基于RL增强模型推理能力,打造电商领域最懂用户需求的超级大脑(含多模态VLM研发)。 为什么选择淘天? 1.坐拥电商领域最大规模场景:每天处理数亿次用户交互,覆盖搜索/推荐/广告/客服/营销全链路,你将直接面对全球最复杂的电商需求场景。 2.定义未来购物标准:你研发的模型将服务数亿消费者,结合大语言和多模态模型能力满足用户偏好,影响海量商家经营决策。 3.顶级科研配置:超大规模GPU集群支持大规模参数模型训练,自研分布式框架实现训练推理效率大幅提升,顶级会议发表,前沿技术成果即时输血。 加入我们,你将获得: 1.与NLP/多模态领域顶尖团队共创,解锁大模型在商品理解、智能创作、消费决策、购物对话等场景的无限可能。 2.弹性化的技术路线选择权,既可在大模型基础技术方面突破能力上限,也可深入应用层打造现象级AI产品。 3.打通产学研用全链路:支持技术成果转化顶会论文和专利+百万级ai native用户产品。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。
1. 研究和开发基于深度学习的实时渲染技术,提升游戏画面的真实感和沉浸感; 2. 设计和优化神经网络模型,用于实时图像生成、Mobile AI超分、hlodAI生成等; 3. 负责机器学习的算法和模型开发,包括但不限于:神经网络模型设计,参数调优,各种学习和优化方式尝试。在缺乏训练集的情况下,探索训练方案; 4. 探索和实现动态场景实时渲染的深度学习解决方案,包括GI,阴影等效果; 5. 使用机器学习相关技术,协同策划、美术解决游戏开发流程中的问题,提高开发效率; 6. 跟踪学术界和工业界的最新进展,将前沿技术应用于实际项目中; 7. 为计算资源有限的移动平台编写高性能代码,基于CPU,GPU,NPU的交互开发,探索完全发挥硬件性能的最佳方案。
1.研究前沿AI技术(如大语言模型、多智能体系统、生成式AI等),探索其在游戏研发管线优化及体验升级中的应用场景; 2.设计并开发基于AI Agent的研发工具链。覆盖代码审查、自动化测试、美术资源生成和优化、策划配置生成等环节; 3.定制引擎和工具流。协同策划、美术、程序团队重构工业化管线,建立AI驱动的敏捷研发新模式。
1. 算法系统集成与优化: 负责TTS、V2F、V2M等算法服务的实现,并和UE引擎进行系统级集成,确保高效稳定运行;设计实现算法模块与UE的通信协议、数据接口及实时流式推理管线。 2. UE管线开发与维护: 构建UE与AI服务(AIO)交互框架,管理数据传输(如BlendShape、骨骼数据),保障端到端效果;优化3D角色表情/动作实时驱动流程,解决延迟、同步与性能瓶颈。 3. 跨环节效果调优与Debug: 分析效果表现层级(算法输出→引擎解析→美术渲染),定位失真根源(算法/引擎/资产);协同算法、美术团队制定数据规范与质量标准,主导跨领域优化方案。 4. 技术方案设计: 设计算法模块单元测试与集成测试策略,确保系统鲁棒性及扩展性。