logo of mi

小米多模态Agent算法工程师

社招全职A183721地点:北京状态:招聘

任职要求


1、本科及以上学历,视觉、自然语言处理机器学习相关专业。
2、丰富的深度学习强化学习大模型算法项目经历,对相关算法有深入理解。
3、对大模型技术有深刻了解,具备较强的探索、实践动手能力,有语音或者视觉多模态背景为加分项。
4、熟练使用一种或几种深度学习框架(如pytorchtensorflowpaddlepaddle等)
5、具有良好的分析问题和解决问题的能力,有顶级会议或者刊物发表论文者优先。

工作职责


1. 研究视觉多模态大模型前沿技术,包含但不限于视觉编码器、语言大模型等技术,探索在新一代智能语音助手中的应用。
2. 负责GUI Agent模型的后训练技术改进,包括有监督微调、强化微调和离在线强化学习,提升模型的任务完成率。
3. 负责研发GUI Agent前沿技术研究及在车载/手机/音箱/电视小爱同学落地。
包括英文材料
学历+
NLP+
机器学习+
深度学习+
强化学习+
大模型+
算法+
PyTorch+
TensorFlow+
PaddlePaddle+
相关职位

logo of tongyi
校招通义2026届秋

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 团队致力于优化Qwen基础大模型的Agent能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent的工作包括从模型侧通过 SFT、RL等提升模型的基础agent能力,让模型和 agent框架有效结合;同时也包括agent system的设计与实现,致力于agentic AI真实落地。 1. 从事Qwen基础大模型的通用agent能力优化,包括但不限于tool use、RAG、planning、memory等能力的算法研发和优化;跟进业界agent benchmark,保持Qwen的agent行业领先水平。 2. 推进agentic AI的发展,包括但不限于多模态 agent、code agent、MCP、deep research 等场景的模型优化与产品落地。 3. 研发agent system,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 agent 的评估与测试工作,确保模型的稳定性和有效性。

更新于 2025-08-18
logo of tongyi
社招1年以上技术类-算法

我们致力于优化 Qwen 基础大模型的 Agent 能力和构建完善的LLM智能系统,实现LLM对外界的准确感知、利用与反馈。Agent 的工作一方面包括从模型侧通过SFT、RL等提升模型的基础Agent能力,让我们的模型能和Agent框架有效结合;另一方面包括Agent System的设计与实现,致力于Agentic AI真实落地。 职位描述: 1. 从事Qwen基础大模型的通用 Agent 能力优化,包括但不限于Tool use、RAG、Planning、Memory等能力的算法研发和优化;跟进业界Agent Benchmark,保持Qwen的Agent行业领先水平。 2. 推进Agentic AI的发展,包括但不限于多模态 Agent、Code Agent、MCP、Deep Research等场景的模型优化与产品落地。 3. 研发Agent System,推动AI Agent在架构和性能上的持续优化。 4. 研究、实现和优化最新的强化学习(RL)算法,确保算法的性能和可扩展性。 5. 主导数据收集、环境建模及 Agent 的评估与测试工作,确保模型的稳定性和有效性。

更新于 2025-07-04
logo of jd
社招算法开发岗

参与或主导以下一个或多个关键领域的工作: 1. 大语言模型/多模态大模型SFT微调、指令跟随、后训练RLHF精调与偏好对齐; 2. 大语言模型/多模态大模型强化学习Reasoning模型算法、Reward模型、Verifier等算法研发; 3. 大语言模型/多模态强化Reasoning大模型长CoTs效率效果优化与RL Scaling-law研究; 4. 大语言/多模态大模型Agent算法研发; 5. 大语言/多模态大模型强化学习Test-time Compute在线推理算法研发。

更新于 2025-09-27
logo of bytedance
社招A117221B

团队介绍:BandAI团队致力于探索智能的极限在交易场景的可能性。团队研究方向涵盖LLM、Multimodal、Agent,在北京、上海设有实验室和岗位。加入我们,参与到前沿的大语言模型的研究课题,和优秀的研究员一起探索智能极限。 1、成为研究型人才,在你热爱的课题方向上,探索多模态大模型模型领域最具挑战的长期关键问题; 2、探索研究多模态理解、生成式、强化学习、AIGC等前沿技术; 3、探索多模态RAG、视觉COT、多模态Agent、多模态Reward model、RL等多模态进阶能力; 4、探索多模态Deep research、Computer Using Agent、Useful Image Generation、理解生成一体模型在抖音交易场景的能力。

更新于 2025-05-20