logo of tencent

腾讯搜索应用部-大模型研发工程师

社招全职3年以上搜索-元宝技术地点:北京状态:招聘

任职要求


1.计算机、电子工程等相关专业,2年以上推理优化经验;
2.精通C++/Go/Python,熟悉CUDA/OpenCL高性能编程;
3.至少熟练掌握一种推理框架(TensorRT/Triton/vLLM/…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.参与AI搜索业务的大模型全流程开发,包括架构设计、数据预处理、训练、部署、推理加速等;
2.负责推理框架核心模块的设计与开发,包括算子调度、流量调度、模型管理、推理引擎集成等工作;
3.负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法;
4.调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在业务中的集成应用。
包括英文材料
C+++
Go+
Python+
CUDA+
还有更多 •••
相关职位

logo of alibaba
社招2年以上技术类-算法

负责天猫淘宝海外搜索推荐场景的算法设计和优化,包括并不限于: 1. 负责研发面向消费者端的搜索&推荐算法系统,提升海外用户购物体验以及平台效率 2. 负责超大规模深度学习在用户/商品表征学习、向量化召回、点击/成交转化模型预估等的应用和创新 3. 负责跟进业界先进技术(LLM大模型等)、赋能业务效果提升

更新于 2025-08-26杭州
logo of alibaba
社招2年以上技术类-算法

1、负责大模型算法的研发与优化,提升模型在多语言场景下的性能和效率。 2、参与AI驱动的电商搜索解决方案设计,应用LLM技术进行Query理解和商品多模态理解。 3、跟踪业界最新技术动态,推动大模型在电商领域的创新应用。

更新于 2025-05-13北京
logo of alibaba
社招1年以上

阿里资产技术团队负责建设全球领先的网络资产处置平台,承载司法拍卖、破产处置、珍品交易等多个市场体量巨大的业务,应对海量用户、巨量资金带来的复杂大型互联网系统架构。 1. 复杂场景下的智能算法构建: ○ 负责商品拍卖场景的搜索推荐系统优化,包括基于用户行为的长短期兴趣建模,设计多目标排序策略(精准推荐/惊喜度平衡),解决新品冷启动、多样性打散等业务难题; ○ 构建亿级商品知识体系,研发基于大模型的商品结构化分析、同品识别、属性纠错等多模态商品分析解决方案; ○ 开发基于时序特征的成交价与拍下率预测系统,提升拍卖定价策略的合理性。 2. 前沿算法探索和落地,LLM/GNN/多模态等前沿技术在搜推场景的应用落地,包括: ○ 基于用户意图理解的生成式推荐范式; ○ 图神经网络在异构图谱中的关系挖掘; ○ 基于大模型的知识增强的多模态商品表征。 3. 算法数据闭环建设: ○ 设计科学的效果评估体系,构建AB实验、因果推断与归因分析的全链路验证机制; ○ 推动算法成果转化为关键业务指标的提升(GMV/LTV/用户时长等)。 我们提供: ○ 参与核心系统的架构设计机会; ○ 行业领先的GPU算力集群与数据资源支持; ○ 与顶尖算法团队共同探索搜索推荐技术前沿领域的创新突破。

更新于 2025-07-10杭州
logo of kuaishou
社招3-5年J0012

1. 大模型垂域应用系统的整体架构及业务链路设计,包括但不限于系统设计、算法工程、AIGC应用搭建等; 2. 应用大模型、向量数据库、知识检索、MCP、A2A、 Function calling 等技术,构筑包含 Prompt智能填充、复杂任务规划、大小模型异构调度、数据沉淀和管理的 Agent 平台,用于在游戏开发过程中的能力提效 和游戏智能NPC的开发; 3. 和模型算法同学一起,通过算法和架构结合,改进算法的效果,保证能力的稳定性,降低技术成本; 4. 跟踪最新的智能体技术研究和进展,并在游戏 AI 领域进行创新性探索。

更新于 2025-07-15杭州