高德地图高德-推理引擎工程师-信息研发
社招全职3年以上技术类-开发地点:北京状态:招聘
任职要求
技术能力 1、3年以上推理引擎/高性能计算开发经验,熟悉主流推理框架(TensorRT、Triton、ONNX Runtime等); 2、精通C++/Python,具备CUDA/OpenCL等GPU编程能力,有算子优化实战案例; 3、深入理解计算机体系结构,熟悉模型编译技术(…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、主导AI模型推理引擎的架构设计与核心模块开发,优化LLM、CV等模型的低延迟、高吞吐推理性能; 2、深入硬件层(GPU/TPU/端侧芯片)进行算子和计算图优化,实现模型编译、量化压缩、动态批处理等关键技术; 3、探索大模型推理前沿技术(如 speculative decoding、continuous batching、vLLM优化等); 4、建立推理服务的监控、诊断与调优体系,实现端到端性能瓶颈分析。
包括英文材料
推理引擎+
https://www.youtube.com/watch?v=_dvk75LEJ34
https://www.youtube.com/watch?v=XtT5i0ZeHHE
TensorRT+
https://docs.nvidia.com/deeplearning/tensorrt/latest/getting-started/quick-start-guide.html
This TensorRT Quick Start Guide is a starting point for developers who want to try out the TensorRT SDK; specifically, it demonstrates how to quickly construct an application to run inference on a TensorRT engine.
ONNX+
https://github.com/onnx/tutorials
Open Neural Network Exchange (ONNX) is an open standard format for representing machine learning models.
[英文] Introduction to ONNX
https://onnx.ai/onnx/intro/
This documentation describes the ONNX concepts (Open Neural Network Exchange).
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
还有更多 •••
相关职位
社招3年以上技术类-开发
1、负责构建和优化基于RAG(Retrieval-Augmented Generation)架构的智能问答、知识推理系统 2、开发高效的多模态数据(文本/图像/结构化数据)检索模块,优化Embedding模型与索引算法 3、设计生成模型(如LLM)与检索系统的协同机制,提升结果相关性与逻辑连贯性 4、探索混合检索策略(密集检索+稀疏检索),优化召回率与排序精度 5、构建端到端性能评估体系,设计AB实验验证系统迭代效果 6、跟踪LangChain、LlamaIndex等RAG技术生态,推动前沿技术落地
更新于 2025-07-02北京
社招核心本地商业-业
1、负责美团到家搜索/推荐/营销系统的大模型引擎引擎架构设计与开发,包括大规模模型训练框架、高性能推理引擎构建等核心工作; 2、主导面向多业务场景(外卖/闪购/医药/营销等)的大模型引擎架构设计,优化大模型推理性能,提升吞吐并控制成本; 3、跟踪并研究AI领域前沿技术发展,结合业务需求进行技术预研和落地实践。
更新于 2025-06-13北京|上海
社招3年以上核心本地商业-业
1、负责美团搜推各场景的大模型引擎架构设计与开发,包括大规模模型训练框架、高性能推理引擎构建等核心工作; 2、主导面向多业务场景的大模型引擎架构设计,优化大模型推理性能,提升吞吐并控制成本; 3、跟踪并研究AI领域前沿技术发展,结合业务需求进行技术预研和落地实践。
更新于 2026-03-25上海|北京