阿里巴巴大模型反思和回溯高阶推理能力工程师
任职要求
1.自然语言处理、机器学习、数据挖掘、人工智能等相关专业的硕士生/博士生; 2.熟练掌握Tensorflow、Pytorch等深度学习框架,扎实的编程基础,具备独立的算法实现能力; 3.有LLM实操经验,参与过大模型预训练,SFT,RLHF等项目者优先; 4.良好的逻辑分析能力和数理基础,对算法原理及应用有较深入的理解,在人工智能相关的各类国际顶级会议/期刊中发表过论文者优先。
工作职责
1. 跟进和研发大规模语言模型(LLM)的预训练、持续训练、SFT、RLHF 等技术; 2. 跟进多模态的大模型(vLLM)预训练、SFT、RLHF等技术; 3. 研发基于大模型的淘宝问问助手、ChatBot、检索增强、Code、Longchain等下游应用; 4. 结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。
美团基础研发平台,作为公司的核心技术平台,致力于“零售+科技”的战略发展。我们专注于智能体构建、大模型推理、多模态训练等核心技术,并通过FRIDAY模型工厂与应用工厂,为业务提供稳定、安全、易扩展与技术先进的平台技术和技术能力。我们聚焦于大模型和智能体的前沿算法研究和应用落地,致力于将先进的人工智能技术转化为实际的业务价值。 我们真诚邀请你加入我们,共同推动技术发展,创造行业价值。 1. 负责大模型在业务场景下关键能力的应用研发,包括但不限于知识和指令遵循、分析诊断、深度推理、反思和评估等能力的优化和落地。 2. 深入研究并优化大模型在长文本理解、生成方面的效果和性能,推动相关技术在实际业务中的应用。 3. 研发和优化智能体的function call、多智能体间协调,使其能够高效、准确地调用内部和外部工具,扩展智能体的应用边界。 4. 结合自主Agent的理念,探索和优化模型的能力边界,推动模型在复杂任务上的表现。 5. 与工程团队紧密合作,推动算法模型的工程化落地,包括模型压缩、加速、部署和监控等环节。 6. 跟踪业界前沿技术,结合业务需求进行预研和技术储备,保持团队的技术竞争力。
美团基础研发平台,作为公司的核心技术平台,致力于“零售+科技”的战略发展。我们专注于智能体构建、大模型推理、多模态训练等核心技术,并通过FRIDAY模型工厂与应用工厂,为业务提供稳定、安全、易扩展与技术先进的平台技术和技术能力。我们聚焦于大模型和智能体的前沿算法研究和应用落地,致力于将先进的人工智能技术转化为实际的业务价值。 我们真诚邀请你加入我们,共同推动技术发展,创造行业价值。 1. 负责大模型在业务场景下关键能力的应用研发,包括但不限于知识和指令遵循、分析诊断、深度推理、反思和评估等能力的优化和落地。 2. 负责个人助理、企业知识问答、办公应用等算法工作,推动相关技术在实际业务中的应用。 3. 优化企业内知识和外部信息拓展的查询、跟进、总结能力,提升办公效率。 4. 研发和优化智能体的function call、多智能体间协调,使其能够高效、准确地调用内部和外部工具,扩展智能体的应用边界。 5. 与工程团队紧密合作,推动算法模型的工程化落地,包括模型压缩、加速、部署和监控等环节。 6. 跟踪业界前沿技术,结合业务需求进行预研和技术储备,保持团队的技术竞争力。
美团基础研发平台,作为公司的核心技术平台,致力于“零售+科技”的战略发展。我们专注于智能体构建、大模型推理、多模态训练等核心技术,并通过FRIDAY模型工厂与应用工厂,为业务提供稳定、安全、易扩展与技术先进的平台技术和技术能力。我们聚焦于大模型和智能体的前沿算法研究和应用落地,致力于将先进的人工智能技术转化为实际的业务价值。 我们真诚邀请你加入我们,共同推动技术发展,创造行业价值。 1. 负责大模型在业务场景下关键能力的应用研发,包括但不限于知识和指令遵循、分析诊断、深度推理、反思和评估等能力的优化和落地。 2. 深入理解商家服务、智能销售和经营分析等业务场景,通过任务抽象,能够提炼出这些核心场景的系统性优化方向,提升B端应用的核心价值和体验,赋能行业升级。 3. 研发和优化智能体的function call、多智能体间协调,使其能够高效、准确地调用内部和外部工具,扩展智能体的应用边界。 4. 结合自主Agent的理念,探索和优化模型的能力边界,推动模型在复杂任务上的表现。 5. 与工程团队紧密合作,推动算法模型的工程化落地,包括模型压缩、加速、部署和监控等环节。 6. 跟踪业界前沿技术,结合业务需求进行预研和技术储备,保持团队的技术竞争力。