腾讯元宝-LLM大模型推理工程师
社招全职2年以上元宝技术地点:北京状态:招聘
任职要求
1.熟练掌握 C++/Python/Go语言,有2年以上llm大模型推理优化经验; 2.具备基础的GPU编程能力,包括但不限于Cuda、OpenCL;熟悉至少一种GPU加速库,如cublas、cudnn等; 3.有Tensorrt/Triton/sglang/vll…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.参与服务业务场景的llm大模型部署、运维、推理优化开发等相关工作; 2.负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法; 3.调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在搜索业务中的集成应用。
包括英文材料
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
还有更多 •••
相关职位
社招2年以上CSIG技术
1.参与服务业务场景的llm大模型部署、运维、推理优化开发等相关工作; 2.负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法; 3.调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在搜索业务中的集成应用。
更新于 2025-08-04深圳
社招元宝技术
1.负责大模型训练和推理系统的研发与性能优化,包括但不限于:模型计算性能优化、分布式大模型推理系统、大规模推理流量调度等; 2.负责解决系统高并发、高可靠性、高可扩展性等技术难关; 3.负责大模型训练和推理前瞻性技术架构的调研和引入,技术方案不限于子图匹配、编译优化、模型量化、本地及mooncake分布式kv store等; 4.与算法部门深度合作,进行算法与系统的联合优化。
更新于 2025-06-19深圳
社招3年以上搜索-元宝技术
1.负责AI搜索中大模型后训练方向的核心技术研发、优化与创新,优化Post-training 算法的训练效率和回复效果; 2.研究各领域高质量数据的自动化合成方法,建设高效的线上数据飞轮链路; 3.跟踪AI搜索领域的前沿技术,参与前沿算法研究,推动研究成果在业务场景的落地应用; 4.参与产品讨论,基于技术对产品提出改进建议。
更新于 2026-01-24北京