腾讯数据库推理大模型高级工程师/专家工程师(成都/杭州)

社招全职3年以上CSIG技术2025-06-05地点：成都状态：招聘

扫码手机上打开

任职要求

1.具备3年以上相关领域的工作经验，有推理大模型或大语言模型的设计、研发、部署经验者优先；
2.精通C++、Python等编程语言，有pytorch、transformer、megatron、vllm、sglang等项目的内核研发经验者优先；
3.熟悉常见的大模型及关键技术，如MLA、MTP、CAG等，精通大模型的训练方法、训练数据收集与构造、并行设计技巧，有分布式大模型训练和量化经验者优先；
4.精通常见的强化学习算法，如GRP…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.负责打造业界领先的数据库推理大模型，通过技术创新实现云数据库研发、应用、运维的全线自动化与智能化；
2.构建全大模型训推一体化技术栈，确保数据库推理大模型能够自主提升性能和准确性；
3.深入研究和优化大模型的训练方法，提高模型的效率和效果；
4.与团队合作，持续改进和扩展大模型的应用范围，提升产品的智能化水平。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

C+++

Python+

PyTorch+

Transformer+

还有更多 •••

登录查看完整学习资料

相关职位

阿里云智能-大模型应用开发专家/高级工程师-杭州

社招3年以上云智能集团

团队介绍我们是阿里云智能集团飞天实验室团队，致力于通过技术创新和工程实践推动前沿AI技术的落地与应用。团队聚焦于模型服务的基础研发，覆盖从底层架构设计到上层业务支持的全链路开发工作。我们的目标是打造业界最出色、成本最低、效率最高、规模最大、稳定、易用的模型服务平台，支撑大规模AI模型的研发、部署与推理极致优化，助力企业级AI应用的快速发展。岗位职责 1. 负责大规模语言基础模型、多模态模型、文生图、视频生成模型等AI能力的产品化落地工作； 2. 主要负责通义千问多端核心应用的构建，支持最新模型能力的落地； 3. 支持百炼大模型开发平台上应用组件、场景化应用的开发和落地。

更新于 2025-11-20杭州

业务技术-（急招）高级Java研发工程师-淘宝搜索

社招1年以上

团队介绍淘宝搜索不仅是阿里电商的核心流量入口，更是承接数亿用户购物需求、驱动集团业务增长的超级引擎。作为全集团算法密度最高、数据规模最大、业务复杂度最强的核心场景，我们正在经历从“传统搜索”向“下一代 AI 搜索”的深刻变革。在这里，你的每一行代码都可能重塑亿万用户的购物体验，每一次技术决策都可能驱动电商大盘的增长引擎。搜索远不止“查询”——它是一个高度个性化的超级入口：千人千面、千次搜索千种链路，不同搜索词触发不同的召回、排序与展现策略。业务快速迭代，新场景层出不穷，挑战与创新始终并存。在这里，你面临的既有分布式系统超高并发、极低延迟的架构挑战，也有 AI 大模型在工业级产品落地的无限可能。这不仅是一份工作，更是一块 AI 技术的真实试验田。如果你渴望在AI与工程的交汇点深耕成长，这里就是你成为未来AI型技术人才的最佳土壤。加入我们，与顶尖的算法和工程专家并肩作战，共同定义未来的搜索形态，成为真正的 AI 复合型人才。岗位职责 ● 引领下一代AI原生搜索系统：深度参与“生成式搜索”从理念到产品的全链路建设，推动大模型与传统搜索架构的深度融合。 ● 打造搜索运营智能体：从“AI辅助”迈向“AI自治”，定义并落地新一代智能运营范式，探索Agent在复杂电商场景中的极限能力。 ● 构建虚拟试穿与智能搭配平台：将前沿生成式AI技术转化为亿级用户可感知的极致体验，推动“看图购物”进化为“沉浸式体验购物”，重塑消费决策路径。 ● 夯实亿级高并发智能工程底座：在保障极致稳定性的前提下，突破大模型推理延迟瓶颈，打造支持未来智能电商的高性能、高可用、高智能系统架构。 ● 驱动搜索体验持续跃升：在AI赋能下，同步优化相关性、多样性与转化效率，为用户提升决策质量，为平台开辟新增长曲线。

更新于 2026-04-02杭州

业务技术-（急招）高级Java研发工程师-淘宝搜索

社招1年以上

更新于 2026-04-02杭州

高级软件开发工程师，AI平台

社招2年以上运维开发

特斯拉信息技术部门（工作地点：特斯拉上海超级工厂）正在招聘一名全职IT AI Platform 开发工程师，专注于构建和扩展下一代 AIOps与MLOps平台。随着人工智能技术在企业核心系统（尤其是GenAI平台）中的深入应用，亟需一位能够打通AI研发与生产部署之间壁垒的工程专家。该岗位将负责从模型训练、版本管理、自动化部署到高性能推理服务的完整MLOps体系建设，并主导构建支持本地GPU与云端LLM API融合的混合式推理网关平台，以实现低延迟、高吞吐的企业级AI服务能力。推动GenAI平台及未来AI服务落地的关键力量，将显著提升AI功能的交付效率与稳定性。岗位职责： • 设计、构建和维护可扩展的 MLOps平台，实现AI模型从训练、版本控制、部署到监控的全生命周期管理。 • 基于 vLLM、TensorRT-LLM 、TGI 等框架，在大规模GPU集群上开发并优化大语言模型（LLM）推理流水线。 • 构建融合本地GPU模型与云上LLM API 的混合推理网关平台，实现智能路由、负载均衡与成本性能的优化。 • 搭建自动化 LLM微调（Fine-Tuning）流水线，支持LoRA、QLoRA等参数高效训练方法，涵盖数据预处理、分布式训练与检查点管理。 • 推动 RAG（检索增强生成）能力服务化（RAG-as-a-Service），集成并运维主流向量数据库（如 Pinecone、Milvus、Weaviate）。 • 通过 Prometheus、Grafana、OpenTelemetry 及自研监控方案，保障AI系统的可观测性与稳定性。 • 与AI科学家和应用工程师协作进行模型优化（量化、剪枝、蒸馏），提升推理效率与资源利用率。 • 支持 GenAI CN平台的高性能模型服务需求，确保低延迟、高并发的服务能力。 • 制定AI模型服务的关键性能指标（KPI）与服务等级协议（SLA），量化业务价值与系统表现。 • 使用 GitLab CI、Jenkins、ArgoCD 等工具实现AI工作流的CI/CD自动化，确保可复现性与可审计性。

上海