logo of bytedance

字节跳动大模型训练/推理系统研发工程师-广告业务-筋斗云人才计划(北京/上海)

校招全职A240474B地点:北京状态:招聘

任职要求


1、获得博士学位,人工智能、计算机科学、数学及相关交叉学科专业优先;
2、学术成果:在相关专业方向有深入研究成果、丰富实践经验者优先,如在自然语言处理计算机视觉、数据建模、算法优化等领域有突出表现;
3、编码能力:熟练掌握常见编程语言中任一项,代码编写能力优秀,能够熟练掌握及应用数据结构与基础算法,并且有较强的工程意识,善于进行效果与成本间权衡;…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:广告业务原为商业产品与技术部门,为抖音集团的商业变现提供广告产品与技术,负责端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,践行"激发生意新可能"理念,致力于让营销更省心、更高效、更美好,推动商业的可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里,你将投身建设面向未来的数字营销能力,接触到全球先进的商业产品架构、模型和算法,在互联网广告行业始终创新。

课题背景:
随着人工智能技术的快速发展,大模型技术在交易与广告场景中的应用日益广泛,已成为推动行业创新和效率提升的重要驱动力。大模型凭借其强大的学习能力和泛化性能,在多个领域展现出显著优势。例如,推荐大模型能够精准捕捉用户偏好,提升个性化推荐效果;AIGC(AI-Generated Content)技术可用于广告创意、商品图片和视频生成,大幅降低创作成本并提升内容质量;广告投放诊断系统和诊断助手帮助优化投放策略;智能客服、影片智能剪辑、智能导购、大模型审核、用户序列建模以及多模态广告和用户理解等应用,则通过自然语言处理、多模态数据融合等技术,提升用户体验和业务效率。
然而,交易与广告场景对大模型系统的要求极高,不仅需要模型具备出色的精度和泛化能力,还需在实时性、稳定性、可扩展性等方面满足严苛标准。特别是在大规模分布式训练、推理加速、异构硬件支持、多模态数据处理以及系统集成等方面,存在诸多技术难点。因此,针对交易与广告场景研发和优化大模型系统,不仅是人工智能技术发展的前沿方向,也是行业应用的迫切需求。本课题旨在通过系统和工程领域的深入研究,突破关键技术瓶颈,构建高效、稳定、可扩展的大模型解决方案,为交易与广告场景提供强有力的技术支撑。

课题挑战:
1、大规模分布式训练加速:大模型训练需处理海量数据和高复杂度计算,导致训练耗时长、资源需求大。如何优化分布式训练架构,提升数据并行、模型并行和流水线并行的效率,是首要技术难题。
2、推理加速和性能优化:交易与广告场景对实时性要求极高,如广告投放需毫秒级决策。如何在资源受限环境下通过模型压缩和推理引擎优化实现快速推理,是关键挑战。
3、异构硬件支持:大模型需适配多种硬件平台。如何实现高效部署和负载均衡,确保跨硬件精度一致性和高性能,是技术难点。
4、编译优化:编译优化是过程复杂,如何开发高效编译器,优化长尾/灵活模型或结构在不同Accelerator执行效率并减少延迟,是亟待解决的问题。
5、Agent工程:智能客服和导购等应用需构建自主决策的AI Agent。如何设计高效的Agent系统,支持复杂任务执行,是前沿挑战。
6、强化学习框架:强化学习在广告投放优化等场景中潜力巨大。如何构建高效框架,支持大规模环境训练和推理,是研究难点。

课题内容:
1、大规模分布式训练加速技术
1)研究数据并行、模型并行和混合并行算法,优化训练效率;
2)开发自适应负载均衡机制,减少资源浪费;
3)探索梯度压缩和通信优化技术,降低网络开销;
2、推理加速与性能优化方法
1)研究模型压缩技术(如量化、剪枝),减小模型体积;
2)开发高效推理引擎,支持批量推理和异步处理;
3)针对不同Accelerator的架构加速推理过程;
3、异构硬件支持与优化
1)设计通用部署框架,支持多硬件无缝集成;
2)开发硬件感知调度算法,优化任务分配;
3)研究跨硬件模型迁移技术,确保精度一致;
4、编译优化技术
1)深入优化模型编译器,优化长尾场景的计算开销;
2)研究图优化和算子融合技术,减少计算开销;
3)探索动态优化方法,提升运行时效率;
5、Agent工程与实现
1)设计模块化Agent架构,支持任务分解和决策;
2)开发多模态交互技术,提升用户体验;
3)研究Agent训练与评估方法,优化复杂场景性能;
6、强化学习框架构建
1)开发高效强化学习算法,支持多智能体协作;
2)针对交易与广告场景的训练场景优化训练速度,提升迭代效率;
3)探索强化学习在广告投放中的应用,提升决策效果。
包括英文材料
学历+
NLP+
OpenCV+
还有更多 •••
相关职位

logo of alibaba
社招3年以上技术类-开发

团队与角色介绍: 我们是国际数字商业集团(AIDC)智能引擎事业群下属的广告引擎团队,致力于构建下一代智能广告技术平台。本岗位将深度参与广告引擎核心系统研发,聚焦在线服务架构优化、算法工程化落地、高并发系统性能调优及稳定性保障体系建设,通过技术创新驱动广告业务增长。 岗位职责: 1. 智能广告引擎架构设计 ○ 主导AIDC广告引擎核心模块的技术架构设计与开发,构建高可用、低延迟的在线服务系统 ○ 推进算法工程化落地,设计与实现特征工程、模型训练、在线推理全链路优化方案 2. 大数据处理平台研发 ○ 开发支持千亿级数据处理的分布式计算框架,优化离线批处理与实时流式计算任务效率 ○ 构建高性能特征存储与计算系统,支持毫秒级实时特征抽取与复杂特征交叉计算 3. 系统工程优化 ○ 主导广告检索/排序/机制模块的性能调优,实现QPS与系统资源利用率的持续提升 ○ 设计多级容灾方案,建立全链路监控体系,保障99.99%+的系统可用性

更新于 2025-04-01北京
logo of alibaba
社招1年以上技术类-算法

团队介绍 "阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。" 职位描述 1.负责研发电商多模态预训练模型基座,抽象并解决商品理解的基础问题使得模型具备业务通识能力,并构建针对大模型幻觉问题、推理能力、模型加速等关键问题的系统性解决方案,提高下游业务的迭代效率和效果上限。 2.基于多模态预训练大模型,落地商品理解关键场景任务,比如商品类目/属性/标签预测、商品同款、商品图搜等,实现业务指标提升。 3.学习前沿论文与把握技术趋势,深入理解底层算法原理,探索实验面向未来的硬核技术,实现核心技术突破和技术创新,发表相关论文。

更新于 2025-12-02杭州
logo of xiaohongshu
社招1年以上基础后端

-负责公司新一代统一分布式存储(对象+文件)的核心架构设计与研发。面向 EB 级海量数据,打造百Tbps 级超高带宽与微秒级极低延迟的高可用存储服务,全面支撑AGI、社交、推荐、搜索、电商、广告等核心业务场景 -深入剖析大模型训练与推理的 I/O 特征,攻克集群计算中的 I/O带宽和延迟瓶颈与百亿文件等难题,保障采集、清洗、训练、发布等全流程在统一存储上无缝运行,彻底打破“存储墙”,极致提升 GPU 算力利用率。 -紧跟下一代硬件架构趋势,结合 PCIe 5.0 高带宽特性与QLC、FDP等新型固态存储技术进行底层 I/O 栈重构;探索 CXL 内存/存储池化、DPU/SmartNIC 硬件卸载及 GPUDirect Storage 技术,实现极致的内核旁路(Bypass Kernel)与端到端零拷贝优化,不断突破单机与集群的性能极限。

更新于 2026-04-09北京|上海|杭州
logo of meituan
社招核心本地商业-基

1.负责美团机器学习中台-搜索/推荐/广告场景的训练框架、推理框架等核心引擎的研发; 2.研究大模型和推荐系统的交叉前沿技术,联合业务探索和落地生成式推荐系统。

更新于 2025-06-22北京|上海