logo of tencent

腾讯元宝-LLM大模型推理工程师

社招全职2年以上元宝技术地点:北京状态:招聘

任职要求


1.熟练掌握 C++/Python/Go语言,有2年以上llm大模型推理优化经验;
2.具备基础的GPU编程能力,包括但不限于Cuda、OpenCL;熟悉至少一种GPU加速库,如cublas、cudnn等;
3.有Tensorrt/Triton/sglang/vll…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.参与服务业务场景的llm大模型部署、运维、推理优化开发等相关工作;
2.负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法;
3.调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在搜索业务中的集成应用。
包括英文材料
C+++
Python+
Go+
大模型+
还有更多 •••
相关职位

logo of tencent
社招2年以上CSIG技术

1.参与服务业务场景的llm大模型部署、运维、推理优化开发等相关工作; 2.负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法; 3.调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在搜索业务中的集成应用。

更新于 2025-08-04深圳
logo of tencent
社招元宝技术

1.负责大模型训练和推理系统的研发与性能优化,包括但不限于:模型计算性能优化、分布式大模型推理系统、大规模推理流量调度等; 2.负责解决系统高并发、高可靠性、高可扩展性等技术难关; 3.负责大模型训练和推理前瞻性技术架构的调研和引入,技术方案不限于子图匹配、编译优化、模型量化、本地及mooncake分布式kv store等; 4.与算法部门深度合作,进行算法与系统的联合优化。

更新于 2025-06-19深圳
logo of tencent
社招3年以上搜索-元宝技术

1.负责AI搜索中检索排序方向的核心技术研发、优化与创新,提升检索的相关性、时效性、质量、权威性; 2.负责检索增强与大模型生成的联合优化,解决阅读理解、文本抽取、摘要生成等实际问题; 3.跟踪AI搜索领域的前沿技术,推动研究成果在业务场景的落地应用; 4.参与产品讨论,基于技术对产品提出改进建议。

更新于 2025-11-17北京
logo of tencent
社招1年以上元宝产品

1.自动评估体系建设:设计并搭建大模型自动评估体系,覆盖通用能力及专项能力(如推理、写作、语音、VLM 等);构建评测指标体系与自动化评测流程,推动评测体系标准化、模块化、可扩展化; 2.Benchmark 研究与落地:跟踪国内外前沿大模型评测方法与 Benchmark,研究其评测维度与自动化机制;复现与改造高质量评测集,结合业务场景定制评测任务,确保评测的真实性与可复现性; 3.模型效果分析与策略优化:定期对不同版本模型进行系统评测与对比,输出详细分析报告,识别模型优势与薄弱点;针对记忆、写作、语音、多模态(VLM)等专项能力,设计细粒度评测指标与分析策略,支撑模型迭代方向; 4.用户数据分析与体验优化:持续监测与分析真实用户交互数据,挖掘模型表现的 badcase 与典型问题;与算法及产品团队协作,将用户侧问题转化为可量化的评测指标与优化方案;建立用户体验反馈与评测体系联动机制,推动模型效果持续提升与体验闭环优化; 5.跨团队协作与产品规划:与算法、工程、产品团队紧密配合,定义评测需求与指标体系,推动自动评测体系在实际业务与模型研发中的落地,形成评测 → 分析 → 优化的完整闭环。

更新于 2025-11-08深圳