logo of tongyi

通义通义实验室-端侧AI推理框架技术专家-北京/杭州

社招全职3年以上技术类-开发地点:北京 | 杭州状态:招聘

任职要求


1.  计算机科学、电子工程、自动化或相关专业硕士及以上学历,3年以上端侧AI系统或高性能计算相关工作经验。
2.  精通C/C++,熟悉Python,具备扎实的系统编程与底层优化能力。
3.  深入理解主流AI推理框架(如TensorRT、ONNX Runtime、TFLite、MNN、NCNN、MindSpore Lite等)的架构与实现原理。
4. …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.  主导端侧AI推理框架的整体架构设计与核心模块开发,支持Omni、Speech、VLM等多模态大模型在资源受限设备上的高效运行。
2.  深度优化模型推理性能,包括但不限于算子融合、内存复用、图优化、量化(INT8/INT4)、稀疏化、编译优化(如MLIR/TVM)等关键技术。
3.  针对高通、地平线、MTK、NVIDIA、华为昇腾等主流芯片平台,进行定制化适配与极致性能调优,实现低延迟、低功耗、高吞吐的推理能力。
4.  构建端侧多模态任务调度与资源管理机制,支持语音识别、视觉理解、对话生成等多模型并发执行与协同推理。
5.  与算法、系统、硬件及客户解决方案团队紧密协作,推动从模型训练到端侧部署的端到端Pipeline打通。 
6.  跟踪业界前沿技术(如WebNN、ONNX Runtime Mobile、TensorRT-LLM、ExecuTorch等),引入先进工具链与优化策略。
包括英文材料
学历+
C+
C+++
Python+
TensorRT+
还有更多 •••
相关职位

logo of tongyi
社招8年以上技术类-开发

1. 作为技术负责人,制定并推动多模态交互系统的端云整体工程架构演进路线,覆盖端侧推理、客户端集成、云端服务及协同策略。 2. 主导端侧AI推理框架的设计与优化,包括模型加载、算子加速、内存管理、功耗控制、异构计算(CPU/GPU/NPU)调度等,确保大模型在资源受限设备上的高效运行。 3. 负责Android客户端核心交互模块的架构设计与开发,包括多模态输入采集、实时通信、状态管理、离在线切换、异常恢复等关键能力。 4. 设计高并发、低延迟、可扩展的云端推理服务架构,支持语音识别、大模型生成、多模态融合等服务的弹性部署与动态扩缩容。 5. 构建端云协同机制,实现任务卸载、上下文同步、模型热更新、A/B测试等能力,提升系统整体鲁棒性与迭代效率。 6. 带领应用工程团队,负责关键技术方案评审、核心模块编码、性能压测、线上稳定性保障及团队技术能力建设。 7. 与算法、产品、芯片、测试及客户解决方案团队紧密协作,推动系统从原型验证到规模化商用落地。

更新于 2025-11-20北京|杭州
logo of tongyi
社招5年以上技术类-开发

1. 主导面向ToB场景的Android端多模态交互系统架构设计与核心模块开发,包括语音采集/播放、摄像头控制、传感器融合、UI响应、状态管理等。 2. 与AI算法团队紧密协作,高效集成语音识别(ASR)、语音合成(TTS)、视觉理解(CV)、大语言模型(LLM)等端侧推理模块,优化模型加载、推理调度与资源协同策略。 3. 设计并实现低延迟、高并发的双工对话通道,支持实时打断、动态判停、上下文感知等高级交互能力在端侧的稳定运行。 4. 构建可扩展、可配置的SDK或中间件,支持多行业客户(如车企、手机厂商、IoT设备商)的快速接入与定制化需求。 5. 参与端云协同架构设计,在保障本地交互流畅性的同时,确保数据传输、存储与处理符合GDPR、CCPA、中国《个人信息保护法》等国内外隐私合规要求。 6. 深度集成系统级安全能力,包括应用权限管控、敏感操作审计、安全启动验证、密钥管理及安全OTA升级机制,提升端侧整体安全水位。

更新于 2025-11-23北京|杭州
logo of tongyi
社招5年以上技术类-质量保证

1. 构建端到端的数据与MLOps基础设施,支撑语音、图像、文本、传感器等多模态数据的大规模处理及模型的后训练、评估与部署。 2. 设计自动化数据管线,实现多模态数据的收集、清洗、标注、版本管理、质量监控及隐私合规处理。 3. 主导MLOps核心能力建设,包括实验跟踪、特征管理、训练调度、A/B测试、模型版本控制、灰度发布与在线监控。 4. 搭建覆盖模型能力(如ASR准确率、NLU F1、LLM任务完成率)、系统性能(延迟、资源占用)和用户体验(上下文连贯性、任务成功率)的自动化评测体系。 5. 推动AI驱动的测试创新,探索基于大模型的测试用例自动生成、用户行为模拟、对抗测试等前沿方法。

更新于 2025-11-24北京|杭州
logo of quark
社招2年以上技术类-算法

1. 负责千问&夸克App的多模态应用(图像方向,包括AI生图、AI图片编辑、AI视频,端侧智能修图agent等)的端侧图像处理能力,包括智能滤镜、美颜、美体、特效算法设计、开发与优化 2. 研究和实现人脸、身体关键点检测等计算机视觉算法 3. 针对移动端(iOS/Android/鸿蒙)进行算法优化,确保高性能和低功耗 4. 与产品、工程团队合作,将算法集成到实际产品中

更新于 2025-11-21广州|北京|杭州