腾讯异构计算研发工程师-广告模型平台
任职要求
1.熟悉Linux开发环境,良好的系统编程、数据结构、算法基础、熟悉C++语言开发; 2.熟悉常见的后台服务性能优化手段,具有服务内存,CPU等方面调优经历; 3.熟悉CUDA等异构硬件开发技术栈,有相关性能优化或TensorRT、…
工作职责
1.负责广告等业务中稀疏大模型,稠密大模型的异构推理架构优化,提升服务性能,降低业务成本; 2.负责广告等业务中GPU算子,计算图编译优化等业务开发,支撑业务迭代升级; 3.积极跟进GPU等异构硬件的业内前沿技术,持续完善异构推理加速框架。
阿里资产技术团队负责建设全球领先的网络资产处置平台,承载司法拍卖、破产处置、珍品交易等多个市场体量巨大的业务,应对海量用户、巨量资金带来的复杂大型互联网系统架构。 1. 复杂场景下的智能算法构建: ○ 负责商品拍卖场景的搜索推荐系统优化,包括基于用户行为的长短期兴趣建模,设计多目标排序策略(精准推荐/惊喜度平衡),解决新品冷启动、多样性打散等业务难题; ○ 构建亿级商品知识体系,研发基于大模型的商品结构化分析、同品识别、属性纠错等多模态商品分析解决方案; ○ 开发基于时序特征的成交价与拍下率预测系统,提升拍卖定价策略的合理性。 2. 前沿算法探索和落地,LLM/GNN/多模态等前沿技术在搜推场景的应用落地,包括: ○ 基于用户意图理解的生成式推荐范式; ○ 图神经网络在异构图谱中的关系挖掘; ○ 基于大模型的知识增强的多模态商品表征。 3. 算法数据闭环建设: ○ 设计科学的效果评估体系,构建AB实验、因果推断与归因分析的全链路验证机制; ○ 推动算法成果转化为关键业务指标的提升(GMV/LTV/用户时长等)。 我们提供: ○ 参与核心系统的架构设计机会; ○ 行业领先的GPU算力集群与数据资源支持; ○ 与顶尖算法团队共同探索搜索推荐技术前沿领域的创新突破。
1、 研发业界领先的分布式深度学习训练框架,提供面向大规模稀疏数据的解决方案,服务于快手内部所有推荐类业务场景,包括 短视频、海外、广告、电商、直播等; 2、 多样的业务形态和庞大的业务规模 使得 框架的开发与优化 极富挑战性:万量级 GPU 卡,千亿量级样本,万亿量级参数,PB 量级训练数据; 3、工作内容包括但不限于: (1)参数服务器; (2)多机多卡分布式; (3)网络通信优化(以太网,RDMA); (4)GPU 优化(Kernel 优化,编译优化 等); (5)框架原生化(Tensorflow,PyTorch)。
1.负责美团搜索排序算法以及流量调控系统模型的优化升级,包括序列生成式重排、异构排序、端智能排序、销量预估、量价模型等; 2.负责研究和应用前沿的算法技术,不断优化搜索算法,提高搜索结果的精准度; 3.负责与产品、运营团队紧密合作,根据业务需求调整和优化搜索算法,提升产品的竞争力。
1、负责商业增值的算法工程相关工作,建设机器学习Pipeline,提升算法迭代效率,统一机器学习的开发和部署,以标准化过程生产高性能模型,持续交付; 2、负责在线推理的优化工作,建设CPU+GPU的异构架构,解决大规模模型推理等问题,并能跟随模型的迭代持续进行编译优化,提升优化的普适性以及对新硬件的覆盖能力; 3、负责特征平台的优化升级工作,提升数据生产效率,实现算法场景下数据价值加速流通和赋能提效,并优化在线特征读取性能,且能前瞻性的看到新技术,结合实际场景预判引入; 4、负责算法迭代日常需求沟通,支撑算法生命周期的全链路迭代,理解算法需求的同时可以通用化的进行抽象,提升平台能力面对相似场景的复用性。 5、负责LLM推理引擎优化,基于业界先进经验设计开发及优化LLM推理框架。 6、负责高性能算子开发和优化,针对Transformer等结构,通过指令级、内存访问优化等手段,提升算子性能,充分利用硬件能力。 7、负责跟随业界LLM新技术,并赋能到业务中。