阿里巴巴研究型实习生-阿里妈妈-大模型算法工程师
任职要求
1、计算机、数学或统计学相关专业硕士及以上学历; 2、熟练掌握Java/C++/Python中至少一门语言,有扎实的数据结构和算法基础; 3、熟悉常用的机器学习算法; 4、具备优秀的分析和解决问题的能力,良好的沟通协作能力; 5、有大模型、数据挖掘、机器学习、强化学习、信息检索、自然语言理解、推荐系统、计算广告学及算法博…
工作职责
1、构建面向搜推广场景的生成式通用用户大模型; 2、探索生成式预估模型的技术边界与架构创新; 3、主导大模型系统的工程化落地与全链路优化; 4、结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。
1. 面向有道词典、词典笔、学习规划/小P老师等产品线,负责 Agent 能力的整体方案与核心算法研发,包括任务分解、计划-执行/反思循环(Plan-Execute / ReAct / Reflection)、长短期记忆与工具路由等; 2. 负责 SLM(Small Language Model)持续预训练与指令微调(SFT),构建高效压缩与蒸馏方案,面向端侧/低延迟场景优化推理效率; 3. 设计与实现工具调用(Function/Tool Calling)体系:工具编目与路由、参数填充、结果验证与回退、调用链追踪与可观测性,提升工具使用的成功率与收益; 4. 基于强化学习(PPO/GRPO/DPO 类方法等)与奖励建模,面向语义理解、工具使用成功率、内容生成质量等目标进行对齐与优化,支持离线/在线策略迭代; 5. 负责搜索与排序相关模型:语义检索embedding/rerank、学习排序(pointwise/pairwise/listwise)、点击/转化信号建模与评估; 6. 负责数据全链路:高质量数据构建、策略采样、合成与清洗、去重与去噪、难例挖掘、失败案例回放及工具轨迹数据集构建; 7. 建立系统化评测体系:离线基准(理解/工具成功率/可用性)、端到端任务评测、A/B 实验与线上指标监控,推进效果持续迭代; 8. 推动工程化落地:训练管线与分布式并行、推理服务化与弹性扩缩、缓存与检索加速、成本/时延/稳定性优化; 9. 跨团队协作,与产品、工程、数据及标注团队紧密配合,按期高质量交付,持续提升用户体验与业务指标。
1. 负责自动驾驶世界模型、场景重建相关技术的研究和算法研发; 2. 参与世界模型在自动驾驶场景编辑、闭环仿真场景生成领域的算法研发,解决技术落地过程中的应用问题; 3. 跟进相关领域世界模型的前沿技术,保持技术行业领先。
-与感知模型等算法工程师、决策规划算法工程师协同,设计与实现自动驾驶预测模型算法(高速/城区场景),达成分层架构下较好交互效果 -设计与实现支持多场景、多障碍物类别的可迭代预测算法 -预测模型相关数据挖掘、数据分析、自动迭代等的自动化化研发工作 -探索learning-based决策规划与端到端方案