腾讯腾讯云-大数据LLMops平台研发工程师（深圳/北京/杭州）

社招全职3年以上CSIG技术2025-06-11地点：北京状态：招聘

扫码手机上打开

任职要求

1.3年以上LLM/AI Infra开发经验，主导过完整的大模型生产项目；
2.精通Python/Go，熟悉Kubernetes等云原生技术栈；
3.熟悉PyTorch/TensorFlow, HuggingFace Transformers、MLflow/DVC、llama …

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.设计自动化数据治理流水线，支持多模态数据清洗/标注/增强（文本、图像、表格数据）；
2.打造可视化微调工作台，支持LoRA/QLoRA/Adapter等高效算法一键配置；
3.开发智能评估中心，集成20+评估维度（事实性/安全性/逻辑性/领域适应性；
4.实现高并发推理服务，设计动态批处理/量化压缩/流量调度方案。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

Python+

Go+

Kubernetes+

还有更多 •••

登录查看完整学习资料

相关职位

机器学习平台开发工程师（北京/深圳）

社招3年以上公共技术

1.负责腾讯混元机器学习平台的设计与开发，包括：性能优化，持续提升训练性能，包括多机多卡大规模训练优化，数据交换优化等； 2.深入理解跟踪业界AIGC动态，优化平台技术方案，提升平台易用性，降低大模型研发门槛，不断推进平台的LLMOps能力升级； 3.积极追踪业内AI动态，优化内部技术方案，改进产品性能，不断推进AI架构升级。

更新于 2026-02-11深圳

大模型机器学习平台研发工程师-TikTok AI创新中心（北京/上海）

社招2年以上A241222

团队介绍：TikTok是一个覆盖150个国家和地区的国际短视频平台，我们希望通过TikTok发现真实、有趣的瞬间，让生活更美好。TikTok 在全球各地设有办公室，全球总部位于洛杉矶和新加坡，办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok AI创新中心，是致力于AI基础设施建设和创新研究的部门，探索行业领先的人工智能技术，包括大语言模型，多模态大模型等研究方向。我们希望研发能够处理多语言和海量视频内容理解的模型算法，为用户带来更好的内容消费体验。在Code AI方向，我们利用大语言模型强大的代码理解与推理能力，提升程序性能与研发效率。 1、参与设计并实现高可用、可扩展、分布式大模型机器学习平台，支撑国际化短视频大模型研发与高效迭代； 2、探索业界前沿的大模型工程研发（LLMOps）相关技术，覆盖数据、训练、推理服务、评测、自动化编排、Prompt工程、资源调度等方向; 3、构建高性能大模型推理服务架构，降低推理成本，保障服务高可用运行。

更新于 2024-03-25北京

GPU调度研发工程师

社招5-10年引擎

大模型具备很强的泛化及理解世界能力，在小红书内的众多生产场景遍地开花，大模型的训练和部署已成为许多算法工程师的日常。在多团队、多业务频繁使用的大规模GPU集群上，如何能够通过高效的GPU调度策略，使大家不仅能丝滑地完成训练及部署任务，同时也能充分激发大规模GPU集群的效能，是行业公认的关键挑战。在这里，你可以聚焦LLM场景，接触到超大规模GPU集群，并使用真实负载数据进行深入分析及技术探索。欢迎加入我们，一起探索领先技术改变世界！工作职责： 1、负责万卡规模GPU集群效能分析及优化，通过调度策略优化、在离线混部、集群调度、GPU虚拟化、故障快速恢复、存储&网络加速等手段，提升大规模GPU集群的整体使用效率。 2、负责构建面向大模型训练、微调、推理、部署全流程LLMOps，与下游云原生平台深度融合，支撑大模型在公司内各业务生产链路稳定高效地落地。 3、持续关注业界最新的GPU资源调度相关技术动态，探索建设业界领先的资源调度策略及方法，构建下一代大规模AI资源调度系统。

更新于 2025-10-25北京

算法工程师-大模型应用或RAG方向-APP平台业务

实习高德地图2026

团队介绍：我们是高德地图终端体验团队，在业务层面负责核心的出行业务、用户平台业务、创新业务，以及开放平台业务，在技术能力层面，负责性能，稳定性优化、工程智能化、编译工具等基础设施建设。团队技术非常全面，涉及iOS、Android、JS、C++，Flutter、Serverless、java服务等。团队牛人多，技术氛围好，技术分享和学习互助氛围良好。岗位描述： 1、负责算法在RAG场景下的落地工作，业务场景包括但不限于代码智能生成/信息检索/知识图谱/智能对话/信息总结等； 2、负责RAG调优的算法设计与把控工作，构建例如高效的切片算法、Rerank算法、Query理解模块等，实现高召回率和精确度； 3、推动NL2SQL技术的精准性和性能，提升查询结果的质量； 4、构建完整的端到端LLMOps流程，涵盖数据收集、注解、评估及调优等关键环节。

更新于 2025-03-03北京