logo of amap

高德地图高德-推理引擎工程师-信息研发

社招全职3年以上技术类-开发地点:北京状态:招聘

任职要求


技术能力
1、3年以上推理引擎/高性能计算开发经验,熟悉主流推理框架(TensorRT、Triton、ONNX Runtime等);
2、精通C++/Python,具备CUDA/OpenCL等GPU编程能力,有算子优化实战案例;
3、深入理解计算机体系结构,熟悉模型编译技术(…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、主导AI模型推理引擎的架构设计与核心模块开发,优化LLM、CV等模型的低延迟、高吞吐推理性能;
2、深入硬件层(GPU/TPU/端侧芯片)进行算子和计算图优化,实现模型编译、量化压缩、动态批处理等关键技术;
3、探索大模型推理前沿技术(如 speculative decoding、continuous batching、vLLM优化等);
4、建立推理服务的监控、诊断与调优体系,实现端到端性能瓶颈分析。
包括英文材料
推理引擎+
TensorRT+
ONNX+
C+++
Python+
还有更多 •••
相关职位

logo of amap
社招3年以上技术类-开发

1、负责构建和优化基于RAG(Retrieval-Augmented Generation)架构的智能问答、知识推理系统 2、开发高效的多模态数据(文本/图像/结构化数据)检索模块,优化Embedding模型与索引算法 3、设计生成模型(如LLM)与检索系统的协同机制,提升结果相关性与逻辑连贯性 4、探索混合检索策略(密集检索+稀疏检索),优化召回率与排序精度 5、构建端到端性能评估体系,设计AB实验验证系统迭代效果 6、跟踪LangChain、LlamaIndex等RAG技术生态,推动前沿技术落地

更新于 2025-07-02北京
logo of meituan
社招核心本地商业-业

1、负责美团到家搜索/推荐/营销系统的大模型引擎引擎架构设计与开发,包括大规模模型训练框架、高性能推理引擎构建等核心工作; 2、主导面向多业务场景(外卖/闪购/医药/营销等)的大模型引擎架构设计,优化大模型推理性能,提升吞吐并控制成本; 3、跟踪并研究AI领域前沿技术发展,结合业务需求进行技术预研和落地实践。

更新于 2025-06-13北京|上海
logo of meituan
社招3年以上核心本地商业-业

1、负责美团搜推各场景的大模型引擎架构设计与开发,包括大规模模型训练框架、高性能推理引擎构建等核心工作; 2、主导面向多业务场景的大模型引擎架构设计,优化大模型推理性能,提升吞吐并控制成本; 3、跟踪并研究AI领域前沿技术发展,结合业务需求进行技术预研和落地实践。

更新于 2026-03-25上海|北京
logo of bytedance
社招A208771

1、负责LLM/VLM/SD等模型推理优化加速、推理引擎和框架研发,服务于字节跳动内部业务; 2、通过编译优化、并行计算优化、图融合、高效CUDA算子开发、低精度计算、流式推理、投机采样、高并发服务请求优化等高性能优化技术打造业界领先的大模型推理引擎; 3、与公司各算法部门深度合作,分析业务性能瓶颈,对大模型进行性能分析与优化,投入大模型工具链开发及技术生态的建设。

更新于 2024-03-18北京