logo of amap

高德地图高德-大模型强化学习高级算法专家-信息研发

社招全职5年以上技术类-算法地点:北京状态:招聘

任职要求


1、5年以上AI领域研发经验,具有一定的团队管理经验
2、深入理解Transformer架构和大模型技术体系,掌握LLM最新研究进展
3、具备大规模模型训练和优化经验,熟悉分布式训练框架
4、对模型压缩、知识蒸馏、参数高效微调等技术有深入研究
5、掌握Megatron/DeepSpeed等分布式训练框架
6、有大型AI系统架构设计经验,了解大模型产品化落地要求

加分项:
1、在顶级会议/期刊发表过高水平论文
2、主导过大语言模型或多模态模型的研发
3、有知名开源项目维护经验
4、具备AI领域应用落地的系统经验

工作职责


1、负责大模型应用训练团队的技术方向规划和团队建设,制定大模型应用场景训练优化的技术路线图
2、带领团队完成应用场景下,大模型训练、推理、优化等关键技术挑战
3、统筹大模型后训练、领域适配、知识注入等核心项目的研发进度
4、与产品、工程等团队紧密协作,确保项目高效交付
5、负责团队的技术创新和人才培养,建立技术壁垒
包括英文材料
Transformer+
大模型+
Megatron+
DeepSpeed+
系统设计+
相关职位

logo of quark
社招5年以上技术类-算法

主导通用AIAgent(对标Manus等前沿形态)的核心算法研发与技术落地,带领团队攻克大模型驱动下的信息搜集、智能决策、智能办公等关键技术难题,构建具备搜索增强、自然对话能力的新一代通用智能体,支撑业务在多领域的创新应用。 具体职责: 1.算法研发与创新:牵头通用AIAgent的核心算法设计,包括但不限于大模型微调与强化学习、智能规划与决策、多模态信息融合、搜索增强机制等,持续提升Agent的通用性与任务执行能力。 2.场景落地与优化:聚焦搜索、对话等核心应用场景,主导算法方案的落地实施,结合业务需求迭代优化模型效果,解决实际场景中的技术瓶颈(如上下文理解、意图识别、多轮交互连贯性等)。 3.团队管理与赋能:带领5-10人算法团队开展研发工作,制定技术研发计划,统筹项目进度,搭建高效协作机制;指导团队成员成长,提升团队整体技术水平与创新能力。 4.技术攻坚与前瞻布局:跟踪国内外通用Agent、大模型领域的前沿技术动态(如顶会论文、行业实 践),主导技术预研与攻关,推动技术成果转化,保障团队技术竞争力。 5.跨部门协作与国际化支持:与产品、业务等部门深度协作,明确技术需求与落地路径;若涉及海外业务,需主导适配海外场景的算法优化,提供国际化技术支持。

更新于 2025-10-13
logo of quark
社招3年以上技术类-算法

岗位描述: 全面负责夸克大模型在 Post-Training 能力进化和上限突破、持续推进模型能力边界和商业价值的不断延伸。通过对前沿算法的极致探索和高效能工程体系的构建,驱动模型在逻辑推理、问答、复杂多轮上下文、指令遵循、Agent 智能体、多模态交互等关键领域实现突破性进展,打造世界一流的模型效果,并定义其在未来 AI 应用中的核心价值。 工作职责: ● 【战略规划与技术引领】 制定并执行大模型 Post-training 的中长期技术路线图,预判并布局下一代对齐技术、能力增强及对齐方案。主导核心算法的战略方向,确保技术路径与公司业务战略高度协同。 ● 【核心能力与壁垒构建】 领导团队进行体系化的数据驱动实验,不仅局限于日常迭代,更要建立可规模化的能力提升范式。您将攻坚并解决模型在复杂指令遵循、通用问答、RAG、深度逻辑推理、内容创作、Tool-Using 等方面的瓶颈问题,构建技术壁垒。 ● 【前沿算法研究与创新】 深入探索并推动 Post-training 领域的前沿算法创新,包括但不限于 RLHF/RLAIF 的新范式、模型融合 (Model Fusion/Merge) 、模型蒸馏及 MoE 模型的高效对齐策略。您的目标是显著降低模型幻觉、提升推理的效果、加强模型复杂指令的遵循能力。 ● 【多模态与未来探索】 从统一多模态模型的战略视角出发,您将指导并规划多模态统一大模型的 Post-training 技术融合。探索并落地高效的多模态 SFT 数据构建、跨模态能力协同训练及对齐策略,确保模型在图文问答、视频对话 等复杂场景下实现无缝、精准的理解与生成。 ● 【团队领导与效能提升】 负责 Post-training 算法团队的组建、培养与管理,打造一支具备高效执行力和持续创新能力的顶尖团队。您将指导并优化从研究、实验、评测到部署的全链路工具链与工程框架,实现研发效能的倍增。

更新于 2025-09-16
logo of amap
社招5年以上技术类-算法

设计并实现复杂动态场景下的智能体实时运动规划与控制算法,跟踪强化学习、大模型与规划控制结合的前沿方向,提升智能体在未知开放环境中的鲁棒性和适应性。

更新于 2025-09-04
logo of quark
社招2年以上技术类-算法

1. 负责召回、排序等相关模块,包括但不限于索引构建、向量召回、召回打分、粗排、精排、重排等工作,洞察业务需求,为用户提升更好的搜索体验 2. 负责大语言模型和多模态大模型相关研发。追踪前沿技术热点,开展预训练、sft、强化学习,并应用到搜索业务、推荐业务、AI产品中 3. 负责应用NLP/CV/多模态等相关技术,理解用户生产的内容,技术方向包括但不限于: 图文和视频等内容类型的打标分类、内容质量打标、热点发现、评论分析等;

更新于 2025-08-18