字节跳动广告架构高级工程师-Ads ML Infra
任职要求
1、熟练掌握Linux环境下的C/C++编程; 2、对深度学习模型推理及训练有过实际上手经验,熟悉至少一种机器学习框架; 3、具有独立解决问题的能力,良好的团队合作精神,具备优秀的复杂…
工作职责
1、负责100+B参数模型,1M序列长度的大规模分布式训练(DDP/F SDP/TP/SP/PP)和推理支持(RPC框架/VLLM/TRT); 2、与算法部门深度合作,进行算法与系统的联合优化; 3、负责机器学习效率优化,包括但不限于: 量化、剪纸、压缩、蒸馏、特征选择、NAS、编译优化; 4、负责特殊机器学习范式的支持,例如强化学习、联邦学习、图学习、优化器等。
1、召回、粗排、精排架构,与算法团队合作,设计并实现包括:ANN召回算法架构、GPU召回算法架构等,解决海量候选场景下的广告排序问题。支撑亿级广告候选排序、优化模型分发速度、提升在线的推理性能、探索业内最新算法的工程落地等,助力业务指标增长; 2、预估与策略平台与架构,设计和实现模型部署和资源调度平台,提升模型资源利用率;设计和实现通用的排序策略框架,通过DSL、图化架构、图编译优化、行列存储数据结构等技术,落地高性能、易使用的排序策略框架,提升排序系统的迭代效率和性能; 3、算力调度平台与架构,设计并实现广告投放系统的延迟、降级、限流、算力分配的自动化、一体化平台和架构,提升广告系统的变现效率和系统稳定性; 4、排序业务工程,基于广告业务特点,设计并实现排序业务架构,包括排序近线系统、LLM模型推理框架、AIGC创意生成框架等。
1. 支撑快手电商亿级用户推荐系统的分布式召回引擎设计、开发与性能优化,推动召回能力的平台化建设,提升策略迭代效率与系统复用性; 2. 参与多路召回策略(如向量召回、行为序列召回、图召回、规则召回等)的架构实现,持续提升召回覆盖率、多样性与相关性,同时沉淀通用召回组件与平台能力; 3. 构建高可用、高性能的特征生产与管理体系,覆盖离线、近线、在线全链路的特征抽取、计算、存储与服务,推进特征平台化演进,保障特征一致性、时效性与易用性; 4. 与算法、数据、存储团队紧密协作,将业务需求高效转化为可扩展、可维护的技术方案,推动推荐效果与系统性能双提升。
-负责百度用户增长基础架构搭建,保证系统的高性能、高可用、高效率的稳定交付 -负责用户增长中台系统的架构设计和针对现有技术架构的优化改进 -从用户、产品和技术综合角度考虑,利用技术和数据分析手段,协同产品实现用户增长目标 -在一个子方向,平衡业务和技术规划,有效地支持产品迭代和技术发展