logo of tongyi

通义通义实验室-应用工程资深技术专家-北京/杭州

社招全职8年以上技术类-开发地点:北京 | 杭州状态:招聘

任职要求


1. 计算机科学、软件工程或相关专业本科及以上学历,8年以上软件开发经验,3年以上担任技术负责人(TL)或主导大型系统架构设计的经验。
2. 精通Android系统开发(Java/Kotlin/C++),深入理解Binder、HAL、SurfaceFlinger、AudioFlinger等底层机制,有系统级性能调优经验。熟悉主流端侧AI推理框架(如TensorRTONNX Runtime、MNN、TFLite、SNPE等),具备模型部署、量化、图优化及硬件适配实战经验。
3. 具备扎实的后端开发能力,熟悉微服务架构(gRPC/REST)、容器化(Docker/K8s)、消息队列(Kafka/Pulsar)及高并发服务设计。
4…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 作为技术负责人,制定并推动多模态交互系统的端云整体工程架构演进路线,覆盖端侧推理、客户端集成、云端服务及协同策略。
2. 主导端侧AI推理框架的设计与优化,包括模型加载、算子加速、内存管理、功耗控制、异构计算(CPU/GPU/NPU)调度等,确保大模型在资源受限设备上的高效运行。 
3. 负责Android客户端核心交互模块的架构设计与开发,包括多模态输入采集、实时通信、状态管理、离在线切换、异常恢复等关键能力。 
4. 设计高并发、低延迟、可扩展的云端推理服务架构,支持语音识别、大模型生成、多模态融合等服务的弹性部署与动态扩缩容。
5. 构建端云协同机制,实现任务卸载、上下文同步、模型热更新、A/B测试等能力,提升系统整体鲁棒性与迭代效率。
6. 带领应用工程团队,负责关键技术方案评审、核心模块编码、性能压测、线上稳定性保障及团队技术能力建设。
7. 与算法、产品、芯片、测试及客户解决方案团队紧密协作,推动系统从原型验证到规模化商用落地。
包括英文材料
学历+
系统设计+
Android+
Java+
Kotlin+
C+++
性能调优+
TensorRT+
ONNX+
MNN+
后端开发+
还有更多 •••
相关职位

logo of xiaohongshu
社招3年以上机器学习平台

【业务介绍】 作为公司统一的机器学习平台团队,负责调度公司所有模型训练与推理资源;基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。 【岗位职责】 1、负责机器学习链路,离在线数据相关的开发工作,包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作;包括样本平台,特征平台,训练平台,推理平台等AI应用后台建设等; 3、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。

上海
logo of xiaohongshu
社招3年以上机器学习平台

【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性

北京|上海|深圳
logo of xiaohongshu
社招2年以上大模型

【职位介绍】 我们团队负责构建小红书推荐算法中台,提高内容分发效率,为海量用户提供极致的推荐体验。在这里,你将参与到推荐系统的全链路搭建和各类算法的研发,包括不限于大模型应用、多模态建模、深度学习、强化学习、迁移学习、表示学习、图学习等领域。我们希望对推荐、搜索、广告感兴趣的同学,加入我们一起研发世界一流的推荐引擎。 1. 负责推荐算法中台的全链路建设,抽象业务共性,敏捷高效支持各类推荐需求。 2. 负责业界先进推荐算法的研发和落地,包括但不限于大模型技术、多模态内容理解、召回算法、排序模型(粗精排)、长短期兴趣建模、多场景联合建模等。

上海|北京
logo of xiaohongshu
社招后端开发

【职位描述】 1、设计和实现机器学习平台业务系统, 包括工具链/组件等AI基础设施, 落地业务功能需求; 2、高效优化和部署 计算机视觉、语音识别、语音合成、自然语言处理 等业务模型; 3、与公司各算法部门深度合作, 分析业务性能瓶颈和系统架构特征, 软硬件结合优化, 实现极致性能。

北京|上海