logo of didi

滴滴大模型推理框架研发工程师(高级/资深)(J250514005)

社招全职技术地点:北京状态:招聘

任职要求


1. 计算机、数学、电子工程、通信等相关专业本科及以上学历.
2. 熟练掌握C++/Python,具备大型项目代码架构设计能力.
3. 熟悉Transformer架构及大模型推理相关技术(如FlashAttention、PagedAttention、Continuous Batching).
4. 有实际大模型部署及调优经验,熟悉量化(INT8/FP8)等优化手段.
5. 有GPU/NPU 算子优化经验,有并行计算相关背景者优先.

工作职责


1. 主导大模型推理引擎的架构设计与核心模块开发,支撑千亿参数模型的高效分布式推理。
2. 研发面向GPU/NPU等异构计算平台的高性能算子,提升硬件利用效率。
3. 参与模型低精度量化,图优化,编译优化等性能优化工作。
4. 攻克分布式推理中的动态负载均衡、通信优化、显存管理等核心技术难题。
5. 跟踪学术界与工业界前沿技术(如vLLM、TGI、TensorRT-LLM等),推进框架迭代。
包括英文材料
学历+
C+++
Python+
系统设计+
Transformer+
大模型+
相关职位

logo of bilibili
社招技术类

1. 负责机器学习推理框架的研发和维护 2. 支持商业技术中心ctr/cvr、召回、CV、NLP等核心模型的在线部署 3. 与算法团队紧密合作,不断优化系统架构和性能

更新于 2025-04-07
logo of ctrip
社招住宿业务AI &

负责 LLM 在软件研发领域的应用与落地,采用包括但不限于LLM、Agent/Multi-agent、Tool Learning、RAG、RLHF等技术,探索大模型和软件研发领域的结合,实现在业务中的应用落地。负责算法模型研发,包含但不限于Embedding、SFT、Self-instruct;参与领域模型的全流程工作,包括但不限于数据、训练、评测、推理部署,保证数据的高质量和有效性;探索Agent在复杂任务中的应用,实现基于LLM的复杂任务在软件研发领域场景的应用落地。

更新于 2025-09-15
logo of netease
社招3-5年网易云音乐

1、主导AI客服系统架构设计,集成大模型、知识库、工单系统及内部工具(如版权库、曲库API),实现用户问题自动分类、意图识别和智能路由,实现用户求助满意度提升; 2、搭建多智能体(Multi-Agent)协作框架,设计客服场景下Agent工作流(如:意图理解Agent、故障诊断Agent、投诉处理Agent),支持跨系统工具调用(MCP、Function Call等); 3、构建客服对话记忆管理、实时决策引擎及服务追踪(Tracing)体系,实现复杂会话状态的持续优化; 4、负责RAG(检索增强生成)系统工程化落地,结合音乐知识库(版权规则、产品文档、歌曲信息等)提升回答准确性; 5、设计客服Agent 反思(Self-Reflection)与思维链(Chain-of-Thought)机制,提升复杂问题处理能力; 6、构建故障诊断推理引擎:基于用户反馈(如“歌曲无法播放”“耳机断连”)以及关联信息,实现自动根因分析; 7、主导系统性能优化与保障,提升千万用户客服体验。

更新于 2025-08-20
logo of oppo
校招AI/算法类

方向一: 岗位职责 面向应用商店、Agent助手、搜索、广告等高价值业务场景,预研和落地信息检索(搜索、推荐、广告)核心技术,岗位职责包括但不限于: 1.针对冷启动推荐、多场景多任务建模、自动特征工程、用户通用表征、多模态信息检索、对话推荐、端云推荐、检索增强生成(RAG)、智能体检索等核心难题,负责研发和突破信息检索关键技术。 2.跟踪学术界和工业界最新进展,快速应用到业务中,提出创新信息检索技术,发表高水平论文。 3.协同核心AI技术的设计以及工程化落地,包括模型设计、特征工程、效率优化等。 方向二: 岗位职责 面向Agent助手、搜索、广告、应用商店等高价值业务场景,预研和落地智能体检索和推理大模型(r1/o1/o3)核心技术,岗位职责包括但不限于: 1.针对大推理模型(r1/o1/o3)、端侧大模型、多模态信息检索、AI搜索推荐、检索增强生成(RAG)、个性化内容生成、大模型特征生成等核心难题,负责研发和突破关键技术。 2.跟踪学术界和工业界最新进展,快速应用到业务中,提出创新信息检索技术,发表高水平论文。 3.协同核心AI技术的设计以及工程化落地,包括模型设计、特征工程、效率优化等。 【岗位资源】 1.真实大规模搜推广、用户助手业务场景需求、数据、AI开发平台、计算资源。 2.与知名高校资深老师团队科研合作,提供例行科研沟通合作机会。 3.业界资深研究员带队技术探索、落地、论文写作发表。

更新于 2025-07-23