高德地图高德-大模型强化学习高级算法专家-信息研发
任职要求
1、5年以上AI领域研发经验,具有一定的团队管理经验 2、深入理解Transformer架构和大模型技术体系,掌握LLM最新研究进展 3、具备大规模模型训练和优化经验,熟悉分布式训练框架 4、对模型压缩、知识蒸馏、参数高效微调等技术有深入研究 5、掌握Meg…
工作职责
1、负责大模型应用训练团队的技术方向规划和团队建设,制定大模型应用场景训练优化的技术路线图 2、带领团队完成应用场景下,大模型训练、推理、优化等关键技术挑战 3、统筹大模型后训练、领域适配、知识注入等核心项目的研发进度 4、与产品、工程等团队紧密协作,确保项目高效交付 5、负责团队的技术创新和人才培养,建立技术壁垒
主导通用AIAgent(对标Manus等前沿形态)的核心算法研发与技术落地,带领团队攻克大模型驱动下的信息搜集、智能决策、智能办公等关键技术难题,构建具备搜索增强、自然对话能力的新一代通用智能体,支撑业务在多领域的创新应用。 具体职责: 1.算法研发与创新:牵头通用AIAgent的核心算法设计,包括但不限于大模型微调与强化学习、智能规划与决策、多模态信息融合、搜索增强机制等,持续提升Agent的通用性与任务执行能力。 2.场景落地与优化:聚焦搜索、对话等核心应用场景,主导算法方案的落地实施,结合业务需求迭代优化模型效果,解决实际场景中的技术瓶颈(如上下文理解、意图识别、多轮交互连贯性等)。 3.团队管理与赋能:带领5-10人算法团队开展研发工作,制定技术研发计划,统筹项目进度,搭建高效协作机制;指导团队成员成长,提升团队整体技术水平与创新能力。 4.技术攻坚与前瞻布局:跟踪国内外通用Agent、大模型领域的前沿技术动态(如顶会论文、行业实 践),主导技术预研与攻关,推动技术成果转化,保障团队技术竞争力。 5.跨部门协作与国际化支持:与产品、业务等部门深度协作,明确技术需求与落地路径;若涉及海外业务,需主导适配海外场景的算法优化,提供国际化技术支持。
设计并实现复杂动态场景下的智能体实时运动规划与控制算法,跟踪强化学习、大模型与规划控制结合的前沿方向,提升智能体在未知开放环境中的鲁棒性和适应性。
1. 负责召回、排序等相关模块,包括但不限于索引构建、向量召回、召回打分、粗排、精排、重排等工作,洞察业务需求,为用户提升更好的搜索体验 2. 负责大语言模型和多模态大模型相关研发。追踪前沿技术热点,开展预训练、sft、强化学习,并应用到搜索业务、推荐业务、AI产品中 3. 负责应用NLP/CV/多模态等相关技术,理解用户生产的内容,技术方向包括但不限于: 图文和视频等内容类型的打标分类、内容质量打标、热点发现、评论分析等;