字节跳动大模型训练/推理系统研发工程师-广告业务-筋斗云人才计划（北京/上海）

校招全职A240474B2025-05-26地点：北京状态：招聘

扫码手机上打开

任职要求

1、获得博士学位，人工智能、计算机科学、数学及相关交叉学科专业优先；
2、学术成果：在相关专业方向有深入研究成果、丰富实践经验者优先，如在自然语言处理、计算机视觉、数据建模、算法优化等领域有突出表现；
3、编码能力：熟练掌握常见编程语言中任一项，代码编写能力优秀，能够熟练掌握及应用数据结构与基础算法，并且有较强的工程意识，善于进行效果与成本间权衡；…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

团队介绍：广告业务原为商业产品与技术部门，为抖音集团的商业变现提供广告产品与技术，负责端到端大型广告系统建设，覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵，践行"激发生意新可能"理念，致力于让营销更省心、更高效、更美好，推动商业的可持续增长，让不分体量、地域的企业及个体，都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里，你将投身建设面向未来的数字营销能力，接触到全球先进的商业产品架构、模型和算法，在互联网广告行业始终创新。

课题背景：
随着人工智能技术的快速发展，大模型技术在交易与广告场景中的应用日益广泛，已成为推动行业创新和效率提升的重要驱动力。大模型凭借其强大的学习能力和泛化性能，在多个领域展现出显著优势。例如，推荐大模型能够精准捕捉用户偏好，提升个性化推荐效果；AIGC（AI-Generated Content）技术可用于广告创意、商品图片和视频生成，大幅降低创作成本并提升内容质量；广告投放诊断系统和诊断助手帮助优化投放策略；智能客服、影片智能剪辑、智能导购、大模型审核、用户序列建模以及多模态广告和用户理解等应用，则通过自然语言处理、多模态数据融合等技术，提升用户体验和业务效率。
然而，交易与广告场景对大模型系统的要求极高，不仅需要模型具备出色的精度和泛化能力，还需在实时性、稳定性、可扩展性等方面满足严苛标准。特别是在大规模分布式训练、推理加速、异构硬件支持、多模态数据处理以及系统集成等方面，存在诸多技术难点。因此，针对交易与广告场景研发和优化大模型系统，不仅是人工智能技术发展的前沿方向，也是行业应用的迫切需求。本课题旨在通过系统和工程领域的深入研究，突破关键技术瓶颈，构建高效、稳定、可扩展的大模型解决方案，为交易与广告场景提供强有力的技术支撑。

课题挑战：
1、大规模分布式训练加速：大模型训练需处理海量数据和高复杂度计算，导致训练耗时长、资源需求大。如何优化分布式训练架构，提升数据并行、模型并行和流水线并行的效率，是首要技术难题。
2、推理加速和性能优化：交易与广告场景对实时性要求极高，如广告投放需毫秒级决策。如何在资源受限环境下通过模型压缩和推理引擎优化实现快速推理，是关键挑战。
3、异构硬件支持：大模型需适配多种硬件平台。如何实现高效部署和负载均衡，确保跨硬件精度一致性和高性能，是技术难点。
4、编译优化：编译优化是过程复杂，如何开发高效编译器，优化长尾/灵活模型或结构在不同Accelerator执行效率并减少延迟，是亟待解决的问题。
5、Agent工程：智能客服和导购等应用需构建自主决策的AI Agent。如何设计高效的Agent系统，支持复杂任务执行，是前沿挑战。
6、强化学习框架：强化学习在广告投放优化等场景中潜力巨大。如何构建高效框架，支持大规模环境训练和推理，是研究难点。

课题内容：
1、大规模分布式训练加速技术
1）研究数据并行、模型并行和混合并行算法，优化训练效率；
2）开发自适应负载均衡机制，减少资源浪费；
3）探索梯度压缩和通信优化技术，降低网络开销；
2、推理加速与性能优化方法
1）研究模型压缩技术（如量化、剪枝），减小模型体积；
2）开发高效推理引擎，支持批量推理和异步处理；
3）针对不同Accelerator的架构加速推理过程；
3、异构硬件支持与优化
1）设计通用部署框架，支持多硬件无缝集成；
2）开发硬件感知调度算法，优化任务分配；
3）研究跨硬件模型迁移技术，确保精度一致；
4、编译优化技术
1）深入优化模型编译器，优化长尾场景的计算开销；
2）研究图优化和算子融合技术，减少计算开销；
3）探索动态优化方法，提升运行时效率；
5、Agent工程与实现
1）设计模块化Agent架构，支持任务分解和决策；
2）开发多模态交互技术，提升用户体验；
3）研究Agent训练与评估方法，优化复杂场景性能；
6、强化学习框架构建
1）开发高效强化学习算法，支持多智能体协作；
2）针对交易与广告场景的训练场景优化训练速度，提升迭代效率；
3）探索强化学习在广告投放中的应用，提升决策效果。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

NLP+

OpenCV+

还有更多 •••

登录查看完整学习资料

相关职位

阿里国际-高级C++开发工程师（智能引擎&架构）-北京

社招3年以上技术类-开发

团队与角色介绍：我们是国际数字商业集团（AIDC）智能引擎事业群下属的广告引擎团队，致力于构建下一代智能广告技术平台。本岗位将深度参与广告引擎核心系统研发，聚焦在线服务架构优化、算法工程化落地、高并发系统性能调优及稳定性保障体系建设，通过技术创新驱动广告业务增长。岗位职责： 1. 智能广告引擎架构设计 ○ 主导AIDC广告引擎核心模块的技术架构设计与开发，构建高可用、低延迟的在线服务系统 ○ 推进算法工程化落地，设计与实现特征工程、模型训练、在线推理全链路优化方案 2. 大数据处理平台研发 ○ 开发支持千亿级数据处理的分布式计算框架，优化离线批处理与实时流式计算任务效率 ○ 构建高性能特征存储与计算系统，支持毫秒级实时特征抽取与复杂特征交叉计算 3. 系统工程优化 ○ 主导广告检索/排序/机制模块的性能调优，实现QPS与系统资源利用率的持续提升 ○ 设计多级容灾方案，建立全链路监控体系，保障99.99%+的系统可用性

更新于 2025-04-01北京

阿里国际-高级算法工程师（多模态大模型）-杭州

社招1年以上技术类-算法

团队介绍 "阿里巴巴国际数字商业集团的智能技术团队，负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合，为用户打造更好更智能化的网上购物体验，同时赋能百万商家实现更高效的经营。选择加入我们意味着投身入于高速发展的国际化电商业务，一起打造最先进的AI技术以驱动全球电商业务发展。" 职位描述 1.负责研发电商多模态预训练模型基座，抽象并解决商品理解的基础问题使得模型具备业务通识能力，并构建针对大模型幻觉问题、推理能力、模型加速等关键问题的系统性解决方案，提高下游业务的迭代效率和效果上限。 2.基于多模态预训练大模型，落地商品理解关键场景任务，比如商品类目/属性/标签预测、商品同款、商品图搜等，实现业务指标提升。 3.学习前沿论文与把握技术趋势，深入理解底层算法原理，探索实验面向未来的硬核技术，实现核心技术突破和技术创新，发表相关论文。

更新于 2025-12-02杭州

分布式存储研发工程师/专家-存储&数据库部

社招1年以上基础后端

-负责公司新一代统一分布式存储（对象+文件）的核心架构设计与研发。面向 EB 级海量数据，打造百Tbps 级超高带宽与微秒级极低延迟的高可用存储服务，全面支撑AGI、社交、推荐、搜索、电商、广告等核心业务场景 -深入剖析大模型训练与推理的 I/O 特征，攻克集群计算中的 I/O带宽和延迟瓶颈与百亿文件等难题，保障采集、清洗、训练、发布等全流程在统一存储上无缝运行，彻底打破“存储墙”，极致提升 GPU 算力利用率。 -紧跟下一代硬件架构趋势，结合 PCIe 5.0 高带宽特性与QLC、FDP等新型固态存储技术进行底层 I/O 栈重构；探索 CXL 内存/存储池化、DPU/SmartNIC 硬件卸载及 GPUDirect Storage 技术，实现极致的内核旁路（Bypass Kernel）与端到端零拷贝优化，不断突破单机与集群的性能极限。

更新于 2026-04-09北京|上海|杭州

机器学习基础架构工程师/专家（推荐大模型系统方向）

社招核心本地商业-基

1.负责美团机器学习中台-搜索/推荐/广告场景的训练框架、推理框架等核心引擎的研发； 2.研究大模型和推荐系统的交叉前沿技术，联合业务探索和落地生成式推荐系统。

更新于 2025-06-22北京|上海