阿里云瓴羊-大模型高级算法工程师/专家(AI专项)-北京/杭州
任职要求
职位要求: 1. 计算机科学相关专业硕士及以上(人工智能、计算机科学、自动化、电子信息工程、数学等); 2. 掌握机器学习/深度学习的基本方法,掌握NLP算法/语音算法等相关的基础知识,有NLP算法/语音相关的实践或研究经验,较强的论文阅读和复现的能力,独立问题分析和解决能力,对解决具有挑战性的问题能充满热情,有顶会论文发表经验优先; 3. 熟悉通用大模型、推理大模型、多语言大模型的预训练、SFT、GRPO、DPO、数据合成等一项或多项技术,有实际项目经验者优先; 4. 具有快速学习能力,有责任感,良好的团队合作和沟通能力。
工作职责
岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可
1、参与LLM方向的新技术研究和落地应用,支持指令微调、强化学习相关算法需求 2、支持通用ai agent在产品业务应用中的落地研发和效果优化,包括但不限于通用ai agent,深入理解大模型和通用ai agent运行原理,明确提升通用ai agent效果的核心技术方向。 3、负责ai agent的框架构建,agent与工具调用的优化,相关场景下大模型的优化,将ai agent框架、工具、大模型有效结合,为通用ai agent效果提供最佳的使用体验。
1. 负责召回、排序等相关模块,包括但不限于索引构建、向量召回、召回打分、粗排、精排、重排等工作,洞察业务需求,为用户提升更好的搜索体验 2. 负责大语言模型和多模态大模型相关研发。追踪前沿技术热点,开展预训练、sft、强化学习,并应用到搜索业务、推荐业务、AI产品中 3. 负责应用NLP/CV/多模态等相关技术,理解用户生产的内容,技术方向包括但不限于: 图文和视频等内容类型的打标分类、内容质量打标、热点发现、评论分析等;
1、 主导/核心参与全模态大模型(文本、图像、视频、音频、3D等)的模型架构与核心算法设计、训练及优化,探索跨模态对齐、多模态融合和原生多模态等前沿技术创新; 2、 开发全模态大模型在具体场景中的应用落地(如实时AI视频通话等方向),将全模态大模型技术与业务需求结合,推动场景化落地; 3、 解决全模态大模型训练和推理的挑战性问题(如模态对齐、长序列建模、高效推理等),跟踪相关领域在学术界与工业界的最新进展等。
【部门介绍】 阿里云智能大数据和智能实验室致力于成为通义大模型与行业的桥梁,积极推动AI大模型时代各行业的智能化升级。团队主要负责行业语言大模型、多模态大模型以及大模型基础研究,主要技术成果已成功应用到智慧交通、城市治理、生物医疗、大型国际赛事(亚运会和奥运会)等多个行业大模型中。 【工作内容】 1、负责大模型核心技术的研究与开发,深入理解其工作原理,不断探索创新的技术及其应用场景;解决复杂问题的推理能力scaling up,探索Post-training的前沿技术,如Agent RL、test time learning,并参与research intern的指导,沉淀技术成果,提升部门的AI技术的影响力及AI产品的竞争力,以支撑业务的持续增长。 2、对大模型的效果进行持续调优,通过高效的Post-training手段(SFT、RL等)提升LLM领域模型在业务场景下的表现,支撑通义的AI普惠影响力建设和模型规模化调用。