阿里云阿里云智能-技术专家/高级开发工程师-通义晓蜜
任职要求
1.本科及以上学历,计算机、人工智能等相关专业毕业;精通Java等主流编程语言,熟悉微服务、分布式系统设计及云原生技术(如Kubernetes、Serverless); 2.具备扎实的计算机基础(如算法、数据库、网络),对开源技术生态有深入理解和实践经验; …
工作职责
1. 负责电话场景(呼入、外呼)语音机器人的工程研发,高效承接产品需求、输出标准技术方案并推进技术方案落地,确保系统的稳定性和可扩展性; 2. 与产品、算法、运营、测试等合作团队积极协同,提升产品的用户提升及技术竞争力,通过技术驱动业务发展; 3. 技术支持,对客户提出的问题可以快速分析原因并给出合理的解决方案; 4. 通过内外部渠道,了解并洞悉客户需求,并凝练形成对应的技术洞察; 5. 通过行业会议、技术媒体、学术研究、友商交流等方式,收集领域内的最新技术信息,包括但不限于技术原理、技术优劣势、应用场景等。
团队介绍 我们是阿里云智能集团飞天实验室团队,致力于通过技术创新和工程实践推动前沿AI技术的落地与应用。团队聚焦于模型服务的基础研发,覆盖从底层架构设计到上层业务支持的全链路开发工作。我们的目标是打造业界最出色、成本最低、效率最高、规模最大、稳定、易用的模型服务平台,支撑大规模AI模型的研发、部署与推理极致优化,助力企业级AI应用的快速发展。 岗位职责 1. 负责大规模语言基础模型、多模态模型、文生图、视频生成模型等AI能力的产品化落地工作; 2. 主要负责通义千问多端核心应用的构建,支持最新模型能力的落地; 3. 支持百炼大模型开发平台上应用组件、场景化应用的开发和落地。
【部门介绍】 阿里云智能大数据和智能实验室致力于成为通义大模型与行业的桥梁,积极推动AI大模型时代各行业的智能化升级。团队主要负责行业语言大模型、多模态大模型以及大模型基础研究,主要技术成果已成功应用到智慧交通、城市治理、生物医疗、大型国际赛事(亚运会和奥运会)等多个行业大模型中。 【工作内容】 1、负责大模型核心技术的研究与开发,深入理解其工作原理,不断探索创新的技术及其应用场景;解决复杂问题的推理能力scaling up,探索Post-training的前沿技术,如Agent RL、test time learning,并参与research intern的指导,沉淀技术成果,提升部门的AI技术的影响力及AI产品的竞争力,以支撑业务的持续增长。 2、对大模型的效果进行持续调优,通过高效的Post-training手段(SFT、RL等)提升LLM领域模型在业务场景下的表现,支撑通义的AI普惠影响力建设和模型规模化调用。
1、 主导/核心参与全模态大模型(文本、图像、视频、音频、3D等)的模型架构与核心算法设计、训练及优化,探索跨模态对齐、多模态融合和原生多模态等前沿技术创新; 2、 开发全模态大模型在具体场景中的应用落地(如实时AI视频通话等方向),将全模态大模型技术与业务需求结合,推动场景化落地; 3、 解决全模态大模型训练和推理的挑战性问题(如模态对齐、长序列建模、高效推理等),跟踪相关领域在学术界与工业界的最新进展等。