通义通义实验室-AI工程与评测技术专家-北京/杭州
任职要求
1. 计算机、人工智能、软件工程或相关专业本科及以上学历,5年以上AI工程化、MLOps或质量保障相关经验。 2. 精通Python,熟悉主流MLOps工具或自动化测试框架,有从0到1搭建平台经验者优先。 3. 掌握多AI模型评测指标(WER、Slot F1、MOS…
工作职责
1. 构建端到端的数据与MLOps基础设施,支撑语音、图像、文本、传感器等多模态数据的大规模处理及模型的后训练、评估与部署。 2. 设计自动化数据管线,实现多模态数据的收集、清洗、标注、版本管理、质量监控及隐私合规处理。 3. 主导MLOps核心能力建设,包括实验跟踪、特征管理、训练调度、A/B测试、模型版本控制、灰度发布与在线监控。 4. 搭建覆盖模型能力(如ASR准确率、NLU F1、LLM任务完成率)、系统性能(延迟、资源占用)和用户体验(上下文连贯性、任务成功率)的自动化评测体系。 5. 推动AI驱动的测试创新,探索基于大模型的测试用例自动生成、用户行为模拟、对抗测试等前沿方法。
岗位描述: 全面负责夸克大模型在 Post-Training 能力进化和上限突破、持续推进模型能力边界和商业价值的不断延伸。通过对前沿算法的极致探索和高效能工程体系的构建,驱动模型在逻辑推理、问答、复杂多轮上下文、指令遵循、Agent 智能体、多模态交互等关键领域实现突破性进展,打造世界一流的模型效果,并定义其在未来 AI 应用中的核心价值。 工作职责: ● 【战略规划与技术引领】 制定并执行大模型 Post-training 的中长期技术路线图,预判并布局下一代对齐技术、能力增强及对齐方案。主导核心算法的战略方向,确保技术路径与公司业务战略高度协同。 ● 【核心能力与壁垒构建】 领导团队进行体系化的数据驱动实验,不仅局限于日常迭代,更要建立可规模化的能力提升范式。您将攻坚并解决模型在复杂指令遵循、通用问答、RAG、深度逻辑推理、内容创作、Tool-Using 等方面的瓶颈问题,构建技术壁垒。 ● 【前沿算法研究与创新】 深入探索并推动 Post-training 领域的前沿算法创新,包括但不限于 RLHF/RLAIF 的新范式、模型融合 (Model Fusion/Merge) 、模型蒸馏及 MoE 模型的高效对齐策略。您的目标是显著降低模型幻觉、提升推理的效果、加强模型复杂指令的遵循能力。 ● 【多模态与未来探索】 从统一多模态模型的战略视角出发,您将指导并规划多模态统一大模型的 Post-training 技术融合。探索并落地高效的多模态 SFT 数据构建、跨模态能力协同训练及对齐策略,确保模型在图文问答、视频对话 等复杂场景下实现无缝、精准的理解与生成。 ● 【团队领导与效能提升】 负责 Post-training 算法团队的组建、培养与管理,打造一支具备高效执行力和持续创新能力的顶尖团队。您将指导并优化从研究、实验、评测到部署的全链路工具链与工程框架,实现研发效能的倍增。
方向一:客户端 AI 工程技术专家 ● 参与支付宝客户端 运行时工程的智能化升级,包括 AI 框架 / AI 应用 / AI 组件 等研发工作; ● 参与支付宝客户端 研发工程的智能化升级,包括 AI 套件 / AI 构建 / AI 提效 等研发工作; ● 参与支付宝客户端 小程序容器的智能化升级,包括 AI 采集 / AI 标注 / AI 执行 等研发工作; 方向二:客户端 AI 多模态技术专家 ● 参与支付宝客户端 实时音视频技术的能力建设,包括 音视频编解码 / 端到端系统优化 等研发工作; ● 参与支付宝客户端 实时网络传输技术的能力建设,包括 流式协议设计 / 低延时系统优化 等研发工作; 方向三:客户端基础技术专家 ● 动态化方向: ○ 参与支付宝客户端 原生跨端架构升级,包括 原生框架 / 应用架构 / 跨端组件 等研发工作; ○ 参与支付宝客户端 跨端技术栈升级,包括 小程序技术 / Hybrid 技术 / H5 技术 等研发工作; ○ 参与支付宝客户端 在跨端新技术上的 调研 / 引入 / 落地 等研发工作; ● 体验优化方向: ○ 参与支付宝客户端 重点场景体验攻坚,包括 解决疑难杂症 / 完成优化目标 / 建设提效工程 等研发工作; ○ 参与支付宝客户端 性能优化 / 稳定性治理 / 监控诊断 / 高可用保障 等研发工作; ● 编译运行方向: ○ 参与支付宝客户端 编译与运行的能力建设,包括 程序语言 / 编译链接 / 指令执行 / 虚拟机 / 运行时 等研发工作;
1、参与Web软件的设计、开发和维护,包括但不限于PC Web站点、移动端H5/小程序、浏览器插件等不同形态的互联网应用; 2、参与AI产品(ToC、ToB、AI基础平台)的全流程,和各角色协同,完成从需求到设计、开发和上线等整个项目周期内的工作; 3、参与AI+不同场景结合的产品开发,AI+带来全新交互形式,深入音视频、图像处理、对话等不同前端领域,提供合适的前端技术解决方案; 4、深入AI工程化领域,AI Coding、模型训部署&评测、AI数据引擎等大模型核心工程场景,期待你的前端全栈的创新技能,来共同思考助推这些领域发展。