logo of aliyun

阿里云阿里云智能-深度学习推理系统研发专家-机器学习PAI

社招全职3年以上云智能集团地点:北京 | 杭州 | 上海状态:招聘

任职要求


● 扎实的工程能力,优良的编程风格,熟悉Python/C++语言和常用设计模式,具备复杂系统的设计开发调试能力。
● 熟悉深度学习的基础理论概念,了解主流模型算法,能够熟练应用PyTorch、TensorFlow等框架。
● 优良的沟通表达能力和团队合作经验,具备快速学习的能力,以及深入钻研技术问题的耐心。
● 熟悉计算机体系结构基础知识,有扎实的高性能Kernel开发(CUDA/Triton/ROCM等)、推理引擎优化(vLLM/SG…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


● 设计和实现高效的分布式推理架构,提升多节点、多GPU环境下的推理速度和资源利用率。开发智能的请求调度算法,确保高并发场景下的最优响应时间和吞吐量。对推理引擎的运行时环境进行深度优化,减少延迟,提高整体性能。针对多种异构AI加速硬件(如NVIDIA GPU, AMD GPU, NPU等),对核心算子进行极致性能优化,最大化算力和访存带宽利用率。
● 探索并实现极低bit量化技术和稀疏化,减少模型存储和计算资源消耗,同时保持推理精度。探索更高效的解码算法,提升生成任务的推理速度。
● 设计并实现能够处理大规模并发请求的系统架构,确保极端负载下的稳定性和性能。引入容错机制、自动恢复和监控报警系统,保证系统的高可用性和稳定性。构建灵活的系统架构,支持动态扩展,以应对未来业务增长和技术演进的需求。
● 持续关注并跟进业界技术发展,尤其是超长上下文、COT思维链、多模态融合等方向。积极尝试和探索新的推理优化方向,提出并验证创新性的解决方案。
包括英文材料
Python+
C+++
设计模式+
深度学习+
算法+
PyTorch+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能集团

阿里云PAI团队致力于打造业界一流的一站式AI工程化平台,拥有万卡级训练能力与超大规模异构资源调度技术,为复杂模型训练与推理任务构建坚实基座。PAI平台不仅是通义大模型研发与落地的核心基础设施,也作为公共云服务的关键载体,支撑众多行企业构建大模型核心业务。平台提供从数据标注、预处理、模型训练、推理服务到开发环境与工作流调度的全链路工程支持,全面覆盖AI项目从实验探索到规模化落地的完整价值链。作为平台研发工程师,您将深度参与以下工作: 1. 负责大规模异构资源管理与模型训练服务的全流程开发,包括需求分析、架构设计、软件开发、质量保障与部署上线。 2. 持续开展系统模块的深度剖析与迭代优化,提升资源利用效率、任务成功率与启动速度,降低使用门槛,增强产品满意度与客户粘性。 3. 负责平台线上环境的实时监控、故障定位与性能调优,为客户提供及时的专业技术支持,保障平台服务的高可用与高稳定运行。 4. 紧密追踪大模型、AIGC等前沿技术趋势,洞察并提炼高价值用户需求,推动平台功能持续演进与技术架构升级。

更新于 2025-12-03北京
logo of aliyun
社招5年以上云智能集团

阿里云PAI团队致力于打造业界一流的一站式AI工程化平台,拥有万卡级训练能力与超大规模异构资源调度技术,为复杂模型训练与推理任务构建坚实基座。PAI平台不仅是通义大模型研发与落地的核心基础设施,也作为公共云服务的关键载体,支撑众多行企业构建大模型核心业务。平台提供从数据标注、预处理、模型训练、推理服务到开发环境与工作流调度的全链路工程支持,全面覆盖AI项目从实验探索到规模化落地的完整价值链。作为Web前端工程师,您将深度参与平台前端体系的构建与持续演进,具体职责涵盖以下方面: 1. 协同产品与设计团队,负责AI平台控制台的前端开发,覆盖标注、训练、推理、编排、监控、开发环境等核心场景,打造专业、易用的交互体验。 2. 面向AI交互场景演进与算力资源类型升级,持续推动前端架构重构与性能优化,提升系统响应速度与操作流畅度。 3. 联合测试、运维与技术支持团队,确保前端系统稳定可靠、兼容性强、易于维护,并能快速响应与修复线上问题。 4. 参与AI Coding、WebIDE、智能Agent、AIGC等方向的前端预研与落地,积极探索下一代AI开发体验的创新路径。

更新于 2025-11-24北京
logo of bytedance
社招A55202

团队介绍:AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责字节跳动机器学习训练/推理框架的研究与开发,服务于全公司各个产品; 2、参与机器学习训练/推理框架底层组件的抽象,设计,优化与落地; 3、与全公司算法部门深度合作,为重点项目进行算法与系统的联合优化。

更新于 2024-11-26上海
logo of bytedance
社招A230004

团队介绍:AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责字节跳动机器学习训练/推理框架的研究与开发,服务于全公司各个产品; 2、参与机器学习训练/推理框架底层组件的抽象,设计,优化与落地; 3、与全公司算法部门深度合作,为重点项目进行算法与系统的联合优化。

更新于 2024-11-26杭州