米哈游【提前批】RL算法工程师
任职要求
1、硕士及以上学历,计算机、数学、人工智能等相关专业,扎实的深度强化学习技术积累; 2、熟练使用Tensorflow/Pytorch等至少…
工作职责
1、负责游戏AI深度强化学习算法设计,提供解决方案等; 2、负责游戏AI前沿算法的研究和开发,包括特征工程,模型训练,效果优化,RL分布式框架等。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 你的挑战: 攻克LLM全链路训练难题:主导大模型训练,优化模型Scaling Law,结合应用需求突破分布式性能瓶颈,基于RL增强模型推理能力,打造电商领域最懂用户需求的超级大脑(含多模态VLM研发)。 为什么选择淘天? 1.坐拥电商领域最大规模场景:每天处理数亿次用户交互,覆盖搜索/推荐/广告/客服/营销全链路,你将直接面对全球最复杂的电商需求场景。 2.定义未来购物标准:你研发的模型将服务数亿消费者,结合大语言和多模态模型能力满足用户偏好,影响海量商家经营决策。 3.顶级科研配置:超大规模GPU集群支持大规模参数模型训练,自研分布式框架实现训练推理效率大幅提升,顶级会议发表,前沿技术成果即时输血。 加入我们,你将获得: 1.与NLP/多模态领域顶尖团队共创,解锁大模型在商品理解、智能创作、消费决策、购物对话等场景的无限可能。 2.弹性化的技术路线选择权,既可在大模型基础技术方面突破能力上限,也可深入应用层打造现象级AI产品。 3.打通产学研用全链路:支持技术成果转化顶会论文和专利+百万级ai native用户产品。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。
1. 参与网易伏羲游戏AI产品的质量保障,包括AIGC、自然语言、用户画像、强化学习等算法测试和性能测试; 2.对产品需求进行分析、评审,提前规避有问题需求,设计测试点、测试用例;积极发现和推动解决项目中的进度、流程、质量风险,并能对项目提出合理建议; 3. 挖掘研发和测试过程中的痛点,通过开发测试平台、工具的等方式来提升研发的质量和效率; 4. 对前沿测试技术有较高的敏感度,思考AI在测试领域的应用,能够引入并应用到工作中。
1、负责滴滴国际化外卖营销方向的需求开发,在充分理解营销业务的基础上进行需求分析、设计、开发、上线等工作; 2、负责相关核心微服务的设计和实现,充分理解业务的发展方向和未来的技术挑战,并作出提前设计和规划; 3、学习研究业界先进技术,保持技术进步。