字节跳动模型工程技术专家（AI Infra）-剪映Capcut

社招全职5年以上A1067662025-12-10地点：深圳状态：招聘

扫码手机上打开

任职要求

1、扎实的机器技术基础，了解前沿的AI技术，有不错的工程实践经验；
2、具备5年以上机器学习系统工程经验，其中至少2年专注于大模型相关方向；精通Python，熟练掌握PyTorch深度学习框架，并具备优秀的C++/Linux开发和调试能力；
3、拥有从零构建或深度改造大规模模型训练/推理管线的成功经验；
4、具备丰富的GPU集群性能调优与问题诊断经验，熟悉CUDA编程…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责将各类大模型（包括MoE架构、多模态模型及未来超大规模模型）高效部署至生产环境，持续跟踪并集成如vLLM、SGLang、xLLM等先进推理框架，保障新模型能够快速、高性能上线；
2、深入数据工程与模型蒸馏领域，通过数据合成、特征工程及知识蒸馏（如软标签蒸馏、特征蒸馏）等技术方案，系统性提升数据利用效率、降低模型部署成本，并验证其在业务中的可行路径；
3、探索并应用创作者Agent等前沿方向，将其能力赋能于训练样本自动合成、Train-Free冷启动及自动化评测等场景，革新传统数据与评估工作流；
4、对业务模型进行深度的推理性能优化，包括但不限于动态批处理、量化压缩、注意力机制优化等，持续降低服务延迟与资源消耗，并积累超大规模（如万亿参数）模型的部署经验与技术储备；
5、负责构建和优化大规模模型的强化学习（RL）、监督微调（SFT）及端到端训练的完整工程链路；提升训练流程的稳定性与吞吐量，并设计和复用离线验证与评测链路，为算法团队提供高效的迭代与效果评估环境。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

机器学习+

大模型+

Python+

PyTorch+

深度学习+

还有更多 •••

登录查看完整学习资料

相关职位

蚂蚁集团-AI-Infra技术专家-杭州/北京/上海

社招3年以上技术-基础平台

1. 负责大模型分布式训练/推理系统性能优化及配套工具研发，包括软硬件协同的模型结构设计与训推系统升级，覆盖MegatronLM、SGLang、Vllm、RL系统等，以及超大规模数据和模型参数下的存储、计算、网络联合优化。 2. 负责多模态数据提取系统研发，结合大模型、传统小模型、Agents等技术，以及异构计算下的流批一体系统，建设高质量多模态数据加工和分析系统。 3. 推动基础引擎与大模型、异构硬件等新技术形态的应用落地，保持在行业内的前沿水平。

更新于 2026-03-27北京|上海|杭州

阿里云智能-异构计算软硬件结合开发专家-AI领域-北京/杭州

社招5年以上云智能集团

1. 针对整机柜超节点服务器，全面赋能计算、互联、监控、故障及性能诊断等核心能力； 2. 梳理适配超节点异构服务器产品的业务场景，开展对应的昆仑组件设计与开发，涵盖性能评测分析、容器镜像等关键模块； 3. 基于整机柜硬件架构及典型业务落地场景，构建典型故障与异常案例库，并设计相应的故障诊断方案； 4. 负责跟踪与研究主流GPU架构设计技术，参与下一代AI Infra的规划与设计； 5. 结合业务画像，构建面向异构硬件与系统的全链路量化分析模型，形成数据驱动的决策数据库，有效推动异构服务器产品的规划与规模化落地。

更新于 2025-11-26北京|杭州

阿里云智能-通义万相大模型推理系统研发专家-AI领域

社招5年以上云智能集团

作为通义万相的AI infra训推优化团队，你将有机会参与或负责以下工作内容： ● 对推理引擎的运行时环境进行深度优化，减少延迟，提高整体性能； ● 针对多种异构AI加速硬件，对核心算子进行极致性能优化，结合量化、蒸馏、cache等技术，降低视频推理成本； ● 开发智能的请求调度算法，确保高并发场景下的最优响应时间和吞吐量； ● 持续关注并跟进业界技术发展，积极尝试和探索新的推理优化方向，提出并验证创新性的解决方案。

更新于 2025-12-19北京|杭州

AI Business-AI Infra研发专家-杭州

社招3年以上技术类-开发

团队介绍：阿里国际以AI技术驱动，助力全球数字贸易及电商生态的发展。AlBusiness是阿里国际内部集大模型研究及智能化前沿产品研发于一体的AI部门，自研面向跨境商贸增强的多语言大模型-Marco和多模态大模型 -Ovis，依托全球化的AI基础设施和算力资源，帮助 AliExpress、Lazada、Alibaba国际站、Trendyol、 Daraz等平台全面革新跨境电商全链路的经营体验和商业效率。基于先进的大模型与工程技术，我们正在打造新一代的智能体（Agent）和智能引擎（Deep Search）产品，持续致力于让全球商业没有语言障碍，用智能帮助跨境贸易更加简单。职位描述： 1. 进行AI Infra相关的研发工作，包括但不限于模型推理引擎，分布式训练框架，模型部署和服务，任务分发和调度，弹性扩缩容，高性能计算集群管理等。 2. 通过AI Infra的研发工作，支持LLM和多模态等大模型的研发、部署和上线服务，支持Agentic AI等新型AI产品的研发和应用，保障客户体验，实现业务落地和成本降低等目标。 3. 与算法、产品、运营以及工程等团队通力合作，推进AI产品和技术的发展和应用。

更新于 2026-01-15杭州