通义通义实验室-云端推理服务技术专家-北京/杭州
任职要求
1. 计算机科学、软件工程或相关专业硕士及以上学历,3年以上后端/云服务/推理平台开发经验。 2. 精通Go/Python/C++至少一种语言,具备扎实的系统编程和高并发服务开发能力。 3. 熟悉主流推理框架(如Triton Inference Server、…
工作职责
1. 设计并构建面向多模态交互(语音、视觉、语言、上下文融合)的云端推理服务平台,支持Omni/Speech/VL等大模型的在线/近线推理。 2. 主导端云协同架构中云端服务模块的技术方案,包括模型服务化(Model Serving)、动态批处理(Dynamic Batching)、请求调度、弹性扩缩容、负载均衡等关键能力。 3. 优化云端推理链路的延迟、吞吐与资源利用率,针对ToB客户对SLA(如99.9% 构建统一的服务治理框架,集成监控告警、日志追踪(如OpenTelemetry)、AB测试、灰度发布、故障自愈等运维能力。 4. 与算法团队紧密协作,推动模型结构适配、量化部署、缓存策略等端云联合优化方案落地。
1. 作为技术负责人,制定并推动多模态交互系统的端云整体工程架构演进路线,覆盖端侧推理、客户端集成、云端服务及协同策略。 2. 主导端侧AI推理框架的设计与优化,包括模型加载、算子加速、内存管理、功耗控制、异构计算(CPU/GPU/NPU)调度等,确保大模型在资源受限设备上的高效运行。 3. 负责Android客户端核心交互模块的架构设计与开发,包括多模态输入采集、实时通信、状态管理、离在线切换、异常恢复等关键能力。 4. 设计高并发、低延迟、可扩展的云端推理服务架构,支持语音识别、大模型生成、多模态融合等服务的弹性部署与动态扩缩容。 5. 构建端云协同机制,实现任务卸载、上下文同步、模型热更新、A/B测试等能力,提升系统整体鲁棒性与迭代效率。 6. 带领应用工程团队,负责关键技术方案评审、核心模块编码、性能压测、线上稳定性保障及团队技术能力建设。 7. 与算法、产品、芯片、测试及客户解决方案团队紧密协作,推动系统从原型验证到规模化商用落地。
1. 具身智能大模型研究与优化 (1) 研究和构建具身智能大模型(Embodied Foundation Models)与机器人大脑。 (2) 探索语言、视觉、动作等多模态融合机制(VLM / VLA / VLA-Agent)。 (3) 优化模型的长时记忆、推理能力与可泛化性。 2. 机器人智能算法研发 (1) 设计和实现机器人多模态感知、导航、操作、交互等核心算法模块。 (2) 推进大模型驱动的机器人任务规划与决策。 (3) 基于模拟器与真实世界数据,进行大规模对齐与强化学习(Sim2Real, RLHF, Imitation Learning)。 3. 系统落地与协同研发 (1) 与硬件与系统团队协作,推动模型算法在真实机器人平台上的部署与性能调优。 (2) 支撑具身智能大模型的云端训练体系、数据闭环与MLOps工程。 (3) 发表高水平论文或申请相关专利,推动业界与学界前沿研究。
1、负责机器学习平台和框架的研发,聚焦AI算法工程师的体验与GPU资源利用率; 2、设计和实现机器学习相关的算法框架以及工具链等,形成自动化Workflow并推动落地到业务中; 3、负责云端推理服务的性能优化和研发工作。
1. 结合质量安全业务场景,主导AI技术方案设计,推动多模态模型、动态知识图谱、风险推理等技术的产品化落地; 2. 制定技术路线图,协调算法、数据、工程团队资源,确保项目从原型到部署的全生命周期管理; 3. 负责多模态消费者投诉数据(文本、图像、音视频)的语义识别、智能标注及关联分析,构建基于事件驱动的动态知识图谱; 4. 开发时序演化模型(如LSTM、Transformer)与因果推理技术,实现产品安全事件演化预测及潜在缺陷关联性分析; 5. 设计并优化风险预警算法,融合知识增强推理(如逻辑规则、图神经网络),提升预警准确性与可解释性,并进行云端模型部署; 6. 协助智能安全与风险预警平台的设计、实现,以及相关监控报警的开发,协助搭建交互系统; 7. 与产品、业务部门紧密沟通,挖掘AI赋能场景(如舆情感知、缺陷追溯,风险分析与风险预警),跟踪大模型、多智能体等技术前沿,探索其在质量安全领域的创新应用。