logo of tencent

腾讯数据库推理大模型高级工程师/专家工程师(成都/杭州)

社招全职3年以上CSIG技术地点:成都状态:招聘

任职要求


1.具备3年以上相关领域的工作经验,有推理大模型或大语言模型的设计、研发、部署经验者优先;
2.精通C++Python等编程语言,有pytorchtransformer、megatron、vllm、sglang等项目的内核研发经验者优先;
3.熟悉常见的大模型及关键技术,如MLA、MTP、CAG等,精通大模型的训练方法、训练数据收集与构造、并行设计技巧,有分布式大模型训练和量化经验者优先;
4.精通常见的强化学习算法,如GRP…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责打造业界领先的数据库推理大模型,通过技术创新实现云数据库研发、应用、运维的全线自动化与智能化;
2.构建全大模型训推一体化技术栈,确保数据库推理大模型能够自主提升性能和准确性;
3.深入研究和优化大模型的训练方法,提高模型的效率和效果;
4.与团队合作,持续改进和扩展大模型的应用范围,提升产品的智能化水平。
包括英文材料
大模型+
C+++
Python+
PyTorch+
Transformer+
还有更多 •••
相关职位

logo of aliyun
社招3年以上云智能集团

团队介绍 我们是阿里云智能集团飞天实验室团队,致力于通过技术创新和工程实践推动前沿AI技术的落地与应用。团队聚焦于模型服务的基础研发,覆盖从底层架构设计到上层业务支持的全链路开发工作。我们的目标是打造业界最出色、成本最低、效率最高、规模最大、稳定、易用的模型服务平台,支撑大规模AI模型的研发、部署与推理极致优化,助力企业级AI应用的快速发展。 岗位职责 1. 负责大规模语言基础模型、多模态模型、文生图、视频生成模型等AI能力的产品化落地工作; 2. 主要负责通义千问多端核心应用的构建,支持最新模型能力的落地; 3. 支持百炼大模型开发平台上应用组件、场景化应用的开发和落地。

更新于 2025-11-20杭州
logo of alibaba
社招1年以上

团队介绍 淘宝搜索不仅是阿里电商的核心流量入口,更是承接数亿用户购物需求、驱动集团业务增长的超级引擎。作为全集团算法密度最高、数据规模最大、业务复杂度最强的核心场景,我们正在经历从“传统搜索”向“下一代 AI 搜索”的深刻变革。 在这里,你的每一行代码都可能重塑亿万用户的购物体验,每一次技术决策都可能驱动电商大盘的增长引擎。搜索远不止“查询”——它是一个高度个性化的超级入口:千人千面、千次搜索千种链路,不同搜索词触发不同的召回、排序与展现策略。业务快速迭代,新场景层出不穷,挑战与创新始终并存。 在这里,你面临的既有分布式系统超高并发、极低延迟的架构挑战,也有 AI 大模型在工业级产品落地的无限可能。这不仅是一份工作,更是一块 AI 技术的真实试验田。如果你渴望在AI与工程的交汇点深耕成长,这里就是你成为未来AI型技术人才的最佳土壤。 加入我们,与顶尖的算法和工程专家并肩作战,共同定义未来的搜索形态,成为真正的 AI 复合型人才。 岗位职责 ● 引领下一代AI原生搜索系统:深度参与“生成式搜索”从理念到产品的全链路建设,推动大模型与传统搜索架构的深度融合。 ● 打造搜索运营智能体:从“AI辅助”迈向“AI自治”,定义并落地新一代智能运营范式,探索Agent在复杂电商场景中的极限能力。 ● 构建虚拟试穿与智能搭配平台:将前沿生成式AI技术转化为亿级用户可感知的极致体验,推动“看图购物”进化为“沉浸式体验购物”,重塑消费决策路径。 ● 夯实亿级高并发智能工程底座:在保障极致稳定性的前提下,突破大模型推理延迟瓶颈,打造支持未来智能电商的高性能、高可用、高智能系统架构。 ● 驱动搜索体验持续跃升:在AI赋能下,同步优化相关性、多样性与转化效率,为用户提升决策质量,为平台开辟新增长曲线。

更新于 2026-01-14杭州
logo of tesla
社招2年以上IT-应用软件

特斯拉信息技术部门(工作地点:特斯拉上海超级工厂)正在招聘一名全职IT AI Platform 开发工程师,专注于构建和扩展下一代 AIOps与MLOps平台。随着人工智能技术在企业核心系统(尤其是GenAI平台)中的深入应用,亟需一位能够打通AI研发与生产部署之间壁垒的工程专家。该岗位将负责从模型训练、版本管理、自动化部署到高性能推理服务的完整MLOps体系建设,并主导构建支持本地GPU与云端LLM API融合的混合式推理网关平台,以实现低延迟、高吞吐的企业级AI服务能力。推动GenAI平台及未来AI服务落地的关键力量,将显著提升AI功能的交付效率与稳定性。 岗位职责: • 设计、构建和维护可扩展的 MLOps平台,实现AI模型从训练、版本控制、部署到监控的全生命周期管理。 • 基于 vLLM、TensorRT-LLM 、TGI 等框架,在大规模GPU集群上开发并优化大语言模型(LLM)推理流水线。 • 构建融合本地GPU模型与云上LLM API 的混合推理网关平台,实现智能路由、负载均衡与成本性能的优化。 • 搭建自动化 LLM微调(Fine-Tuning)流水线,支持LoRA、QLoRA等参数高效训练方法,涵盖数据预处理、分布式训练与检查点管理。 • 推动 RAG(检索增强生成)能力服务化(RAG-as-a-Service),集成并运维主流向量数据库(如 Pinecone、Milvus、Weaviate)。 • 通过 Prometheus、Grafana、OpenTelemetry 及自研监控方案,保障AI系统的可观测性与稳定性。 • 与AI科学家和应用工程师协作进行模型优化(量化、剪枝、蒸馏),提升推理效率与资源利用率。 • 支持 GenAI CN平台的高性能模型服务需求,确保低延迟、高并发的服务能力。 • 制定AI模型服务的关键性能指标(KPI)与服务等级协议(SLA),量化业务价值与系统表现。 • 使用 GitLab CI、Jenkins、ArgoCD 等工具实现AI工作流的CI/CD自动化,确保可复现性与可审计性。

上海
logo of kuaishou
社招3年以上D2863

1、负责大模型应用的工程解决方案的设计与开发,推进大模型AI能力(LLM、VLM、MLLM等)在快手短视频、直播、电商等业务场景的快速落地; 2、理解业务逻辑与产品需求,设计和实现高可用技术方案、满足高并发、海量数据的挑战。持续改进提升系统性能和稳定性,降低推理硬件成本; 3、围绕大模型算法研发,建设高效率的AI模型迭代平台,包括数据标注与管理、模型训练、自动评测和部署,等全流程的工具平台建设。

更新于 2025-02-12北京