腾讯搜索应用部-大模型研发工程师
任职要求
1.计算机、电子工程等相关专业,2年以上推理优化经验; 2.精通C++/Go/Python,熟悉CUDA/OpenCL高性能编程; 3.至少熟练掌握一种推理框架(TensorRT/Triton/vLLM/…
工作职责
1.参与AI搜索业务的大模型全流程开发,包括架构设计、数据预处理、训练、部署、推理加速等; 2.负责推理框架核心模块的设计与开发,包括算子调度、流量调度、模型管理、推理引擎集成等工作; 3.负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法; 4.调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在业务中的集成应用。
负责天猫淘宝海外搜索推荐场景的算法设计和优化,包括并不限于: 1. 负责研发面向消费者端的搜索&推荐算法系统,提升海外用户购物体验以及平台效率 2. 负责超大规模深度学习在用户/商品表征学习、向量化召回、点击/成交转化模型预估等的应用和创新 3. 负责跟进业界先进技术(LLM大模型等)、赋能业务效果提升
1、负责大模型算法的研发与优化,提升模型在多语言场景下的性能和效率。 2、参与AI驱动的电商搜索解决方案设计,应用LLM技术进行Query理解和商品多模态理解。 3、跟踪业界最新技术动态,推动大模型在电商领域的创新应用。
阿里资产技术团队负责建设全球领先的网络资产处置平台,承载司法拍卖、破产处置、珍品交易等多个市场体量巨大的业务,应对海量用户、巨量资金带来的复杂大型互联网系统架构。 1. 复杂场景下的智能算法构建: ○ 负责商品拍卖场景的搜索推荐系统优化,包括基于用户行为的长短期兴趣建模,设计多目标排序策略(精准推荐/惊喜度平衡),解决新品冷启动、多样性打散等业务难题; ○ 构建亿级商品知识体系,研发基于大模型的商品结构化分析、同品识别、属性纠错等多模态商品分析解决方案; ○ 开发基于时序特征的成交价与拍下率预测系统,提升拍卖定价策略的合理性。 2. 前沿算法探索和落地,LLM/GNN/多模态等前沿技术在搜推场景的应用落地,包括: ○ 基于用户意图理解的生成式推荐范式; ○ 图神经网络在异构图谱中的关系挖掘; ○ 基于大模型的知识增强的多模态商品表征。 3. 算法数据闭环建设: ○ 设计科学的效果评估体系,构建AB实验、因果推断与归因分析的全链路验证机制; ○ 推动算法成果转化为关键业务指标的提升(GMV/LTV/用户时长等)。 我们提供: ○ 参与核心系统的架构设计机会; ○ 行业领先的GPU算力集群与数据资源支持; ○ 与顶尖算法团队共同探索搜索推荐技术前沿领域的创新突破。