logo of tongyi

通义通义实验室-端侧AI推理框架技术专家-北京/杭州

社招全职3年以上技术-基础平台地点:北京 | 杭州状态:招聘

任职要求


1.  计算机科学、电子工程、自动化或相关专业硕士及以上学历,3年以上端侧AI系统或高性能计算相关工作经验。
2.  精通C/C++,熟悉Python,具备扎实的系统编程与底层优化能力。
3.  深入理解主流AI推理框架(如TensorRT、ONNX Runtime、TFLite、MNN、NCNN、MindSpore Lite等)的架构与实现原理。
4. …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.  主导端侧AI推理框架的整体架构设计与核心模块开发,支持Omni、Speech、VLM等多模态大模型在资源受限设备上的高效运行。
2.  深度优化模型推理性能,包括但不限于算子融合、内存复用、图优化、量化(INT8/INT4)、稀疏化、编译优化(如MLIR/TVM)等关键技术。
3.  针对高通、地平线、MTK、NVIDIA、华为昇腾等主流芯片平台,进行定制化适配与极致性能调优,实现低延迟、低功耗、高吞吐的推理能力。
4.  构建端侧多模态任务调度与资源管理机制,支持语音识别、视觉理解、对话生成等多模型并发执行与协同推理。
5.  与算法、系统、硬件及客户解决方案团队紧密协作,推动从模型训练到端侧部署的端到端Pipeline打通。 
6.  跟踪业界前沿技术(如WebNN、ONNX Runtime Mobile、TensorRT-LLM、ExecuTorch等),引入先进工具链与优化策略。
包括英文材料
学历+
C+
C+++
Python+
TensorRT+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能集团

1. 算法设计与技术攻坚 a. 负责实人认证、活体检测、证件伪造识别等核心算法的研发与优化,包括但不限于动态活体检测、生物特征防伪(抵御3D面具、屏幕翻拍攻击)、证件信息结构化解析、卡证图片分类等方向 b. Deepfake检测:深入研究并开发Deepfake检测技术,针对日益复杂和多样化的深度伪造手法,设计并优化高效、精准的检测模型和算法。提升现有Deepfake检测方法的泛化性和鲁棒性,确保检测系统能够适应不同场景下(国内业务及国际业务)的伪造人脸,同时具备对新型攻击手段的快速防御和响应能力 c. 攻克复杂环境下的算法鲁棒性问题,如极端光照、遮挡、跨设备兼容性等,确保算法在高并发场景下的稳定运行 d. 主导算法从原型到规模化部署的全链路工作,优化模型推理性能(如端侧SDK轻量化、服务端分布式计算),满足金融级时延与资源消耗要求 2. 算法研究 a. 跟踪CV顶会和AIGC领域前沿进展,确保技术与行业趋势保持一致

更新于 2025-10-22北京|杭州
logo of tongyi
社招3年以上技术类-算法

1. 具身智能大模型研究与优化 (1) 研究和构建具身智能大模型(Embodied Foundation Models)与机器人大脑。 (2) 探索语言、视觉、动作等多模态融合机制(VLM / VLA / VLA-Agent)。 (3) 优化模型的长时记忆、推理能力与可泛化性。 2. 机器人智能算法研发 (1) 设计和实现机器人多模态感知、导航、操作、交互等核心算法模块。 (2) 推进大模型驱动的机器人任务规划与决策。 (3) 基于模拟器与真实世界数据,进行大规模对齐与强化学习(Sim2Real, RLHF, Imitation Learning)。 3. 系统落地与协同研发 (1) 与硬件与系统团队协作,推动模型算法在真实机器人平台上的部署与性能调优。 (2) 支撑具身智能大模型的云端训练体系、数据闭环与MLOps工程。 (3) 发表高水平论文或申请相关专利,推动业界与学界前沿研究。

更新于 2026-02-11北京|杭州
logo of tongyi
社招8年以上技术类-开发

1. 作为技术负责人,制定并推动多模态交互系统的端云整体工程架构演进路线,覆盖端侧推理、客户端集成、云端服务及协同策略。 2. 主导端侧AI推理框架的设计与优化,包括模型加载、算子加速、内存管理、功耗控制、异构计算(CPU/GPU/NPU)调度等,确保大模型在资源受限设备上的高效运行。 3. 负责Android客户端核心交互模块的架构设计与开发,包括多模态输入采集、实时通信、状态管理、离在线切换、异常恢复等关键能力。 4. 设计高并发、低延迟、可扩展的云端推理服务架构,支持语音识别、大模型生成、多模态融合等服务的弹性部署与动态扩缩容。 5. 构建端云协同机制,实现任务卸载、上下文同步、模型热更新、A/B测试等能力,提升系统整体鲁棒性与迭代效率。 6. 带领应用工程团队,负责关键技术方案评审、核心模块编码、性能压测、线上稳定性保障及团队技术能力建设。 7. 与算法、产品、芯片、测试及客户解决方案团队紧密协作,推动系统从原型验证到规模化商用落地。

更新于 2026-04-03北京|杭州
logo of tongyi
社招5年以上技术类-开发

1. 主导面向ToB场景的Android端多模态交互系统架构设计与核心模块开发,包括语音采集/播放、摄像头控制、传感器融合、UI响应、状态管理等。 2. 与AI算法团队紧密协作,高效集成语音识别(ASR)、语音合成(TTS)、视觉理解(CV)、大语言模型(LLM)等端侧推理模块,优化模型加载、推理调度与资源协同策略。 3. 设计并实现低延迟、高并发的双工对话通道,支持实时打断、动态判停、上下文感知等高级交互能力在端侧的稳定运行。 4. 构建可扩展、可配置的SDK或中间件,支持多行业客户(如车企、手机厂商、IoT设备商)的快速接入与定制化需求。 5. 参与端云协同架构设计,在保障本地交互流畅性的同时,确保数据传输、存储与处理符合GDPR、CCPA、中国《个人信息保护法》等国内外隐私合规要求。 6. 深度集成系统级安全能力,包括应用权限管控、敏感操作审计、安全启动验证、密钥管理及安全OTA升级机制,提升端侧整体安全水位。

更新于 2026-02-05北京|杭州