小米多模态大模型智能体算法实习工程师
任职要求
1. 计算机科学、人工智能、电子工程等相关专业在读硕士/博士研究生,博士优先
2. 在以下至少一个方向有扎实的研究基础:
- 多模态大模型(LLM/VLM/MLLM)
- 计算机视觉(检测、分割、视觉理解)
- 智能体(Agent、规划、决策、强化学习)
3. 熟练掌握 Python 及主流深度学习框…工作职责
1. 学术成果转化:将公司在多模态大模型、视觉理解、智能体等方向的技术积累整理为高质量学术论文(顶会/顶刊)及发明专利
2. 预研探索:跟踪前沿进展,在以下一个或多个方向开展预研工作:
- 目标检测与视觉感知(2D/3D 检测、分割、跟踪)
- 多模态视觉理解(VLM、图文推理、视觉问答)
- 智能体规划与决策(Agent Planning、Tool Use、多步推理)
3. 原型验证:设计并实现算法原型,完成实验评估与技术报告撰写
4. 技术协作:与工程团队协同,推动预研成果在产品中的落地验证
探索多模态大模型与Agent 技术在游戏研发、运营及玩家生态中的前沿应用。在这里,你将在资深工程师的指导下,参与现有 AI 产品的维护与持续迭代,并深度参与核心 AI 系统的架构设计,利用大模型技术为游戏业务深度提效。 主要职责: 1. 产品迭代与应用维护:在指导下跟进并负责现有 AI 产品的日常维护与功能迭代。通过数据回流与 Badcase 分析,持续优化 Prompt 策略与模型表现,保障并提升业务场景下的模型产出质量。 2. 多模态大模型探索与落地:探索视觉语言模型(VLM)等多模态技术在游戏业务中的应用。例如:结合图文或音视频流,实现游戏内的bug识别,内容安全审核等功能。 3. Agent 系统架构设计:深度参与 Agent 系统的设计与开发。研究多智能体协同、复杂工具调用、动态规划和长短期记忆管理,打造能帮助业务方提效的agent工作流。 4. 大模型服务部署与工程优化:参与模型的推理加速与工程落地。基于 vLLM / TensorRT-LLM 等框架进行模型服务化,配合团队完成微服务架构下的 AI 接口封装、Docker 容器化部署以及高并发场景下的性能调优。
1、专注于大语言模型(LLM)的前沿技术研究,包括但不限于CPT、SFT、RL,以提升复杂指令遵循能力、多模态大模型、多智能体系统、RAG等方向; 2、探索多模态大模型在电商领域的应用,以及检索增强的LLM等创新应用; 3、搭建自动化的数据处理管道和训练框架,实现模型的快速迭代和评估; 4、参与模型评估工作,包括评估流程的建设与完善、评估方法的设计与优化。
1. 大模型驱动的算法革新: a. 参与大模型(LLM、多模态大模型)在电商核心场景(搜索、推荐、广告、多智能体对话等)中的算法创新与应用; b. 研究大模型与经典搜推广模型的融合方案,提升模型效果与用户体验; 2. 下一代AI系统构建: a. 通过分布式训练、模型压缩、低延迟推理等技术,面向工业级应用完成千亿级参数大模型的高效训练与部署; b. 尝试生成式AI、多智能体协作等前沿方向,推动AI技术在电商领域的创新应用; 3. 大模型在亿级用户规模落地的实战: a. 直面淘宝数亿用户、百亿级行为数据的挑战,落地大模型应用; b. 参与双11、618等顶级电商场景的算法优化,见证大模型技术驱动商业增长的完整链路。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 工作内容: 1. 大模型驱动的算法革新: a. 参与大模型(LLM、多模态大模型)在电商核心场景(搜索、推荐、广告、多智能体对话等)中的算法创新与应用; b. 研究大模型与经典搜推广模型的融合方案,提升模型效果与用户体验; 2. 下一代AI系统构建: a. 通过分布式训练、模型压缩、低延迟推理等技术,面向工业级应用完成千亿级参数大模型的高效训练与部署; b. 尝试生成式AI、多智能体协作等前沿方向,推动AI技术在电商领域的创新应用; 3. 大模型在亿级用户规模落地的实战: a. 直面淘宝数亿用户、百亿级行为数据的挑战,落地大模型应用; b. 参与双11、618等顶级电商场景的算法优化,见证大模型技术驱动商业增长的完整链路。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ④有机会提前获得秋招直通T-Star的正式Offer。