阿里云阿里云智能-大模型研发算法专家/高级算法专家(多模态/全模态/LLM)-北京/杭州
任职要求
1、有多智能体技术、DeepResearch/AgenticSearch、文档智能解析、GRPO/GSPO等RL后训练等相关实战经验; 2、熟悉verl/OpenRLHF/swift/ROLL等后训练框架,熟悉Megatron/DeepSpeed/vLLM/SGLang等主流…
工作职责
1、围绕行业AI应用快速落地,研发端到端智能体核心技术,方向包括但不限于:Agent RL强化学习方法、全模态数据解析与私域知识加工、自规划和自主进化的多智能体等技术,提升智能体在复杂业务流中的效果与适应性。 2、攻坚突破大模型产品在行业应用落地和交付过程中的技术难题,与业界先进技术进行持续对比,并保持优势。 3、具备良好的产品化思维,驱动产品迭代,与产品和工程团队紧密合作,将算法技术应用于实际产品,带来产品商业化增量和竞争力。 4、深入研究大模型和智能体技术,持续关注和探索大模型和智能体方向的前沿动向和技术趋势,打造产品业界影响力。
1. 多模态大模型训练与优化。围绕文本、图像等多模态数据,构建面向安全领域的垂直大模型,推动在内容理解、风险识别等场景的落地应用。 2. 模型架构设计与迭代。基于现有大模型底座,进行模型结构优化、训练策略设计及效果调优,提升模型在实际业务中的泛化能力与推理效率。 3. 数据处理与标注体系建设。构建高质量的多模态训练数据集,设计合理的标注流程与标准,支撑模型训练与评估。 4. 联合业务方推进模型部署与应用。与产品、工程团队紧密协作,完成模型从训练到上线的全流程闭环,并持续跟踪效果与优化。
1. 具身智能大模型研究与优化 (1) 研究和构建具身智能大模型(Embodied Foundation Models)与机器人大脑。 (2) 探索语言、视觉、动作等多模态融合机制(VLM / VLA / VLA-Agent)。 (3) 优化模型的长时记忆、推理能力与可泛化性。 2. 机器人智能算法研发 (1) 设计和实现机器人多模态感知、导航、操作、交互等核心算法模块。 (2) 推进大模型驱动的机器人任务规划与决策。 (3) 基于模拟器与真实世界数据,进行大规模对齐与强化学习(Sim2Real, RLHF, Imitation Learning)。 3. 系统落地与协同研发 (1) 与硬件与系统团队协作,推动模型算法在真实机器人平台上的部署与性能调优。 (2) 支撑具身智能大模型的云端训练体系、数据闭环与MLOps工程。 (3) 发表高水平论文或申请相关专利,推动业界与学界前沿研究。
主导通用AIAgent(对标Manus等前沿形态)的核心算法研发与技术落地,带领团队攻克大模型驱动下的信息搜集、智能决策、智能办公等关键技术难题,构建具备搜索增强、自然对话能力的新一代通用智能体,支撑业务在多领域的创新应用。 具体职责: 1.算法研发与创新:牵头通用AIAgent的核心算法设计,包括但不限于大模型微调与强化学习、智能规划与决策、多模态信息融合、搜索增强机制等,持续提升Agent的通用性与任务执行能力。 2.场景落地与优化:聚焦搜索、对话等核心应用场景,主导算法方案的落地实施,结合业务需求迭代优化模型效果,解决实际场景中的技术瓶颈(如上下文理解、意图识别、多轮交互连贯性等)。 3.团队管理与赋能:带领5-10人算法团队开展研发工作,制定技术研发计划,统筹项目进度,搭建高效协作机制;指导团队成员成长,提升团队整体技术水平与创新能力。 4.技术攻坚与前瞻布局:跟踪国内外通用Agent、大模型领域的前沿技术动态(如顶会论文、行业实 践),主导技术预研与攻关,推动技术成果转化,保障团队技术竞争力。 5.跨部门协作与国际化支持:与产品、业务等部门深度协作,明确技术需求与落地路径;若涉及海外业务,需主导适配海外场景的算法优化,提供国际化技术支持。