logo of baidu

百度推理优化资深研发工程师(J84735)

社招全职MEG地点:北京状态:招聘

任职要求


-计算机软件或相关专业本科以上学历 
-扎实系统功底和编程能力,熟练掌握C++/Python,熟悉常见数据结构设计模式; 
-熟悉深度学习基本原理和Pytorch深度学习框架,有对Pytorch框架二次开发经验者优先 
-熟悉常见AI编译技术,如Torch.compile、TVM等,有相关二次开发经验者优先
-拥有高性能计算或模型优化经验和兴趣,熟练掌握Cuda,或拥有计算密集型优化经验
-热爱技术、有较强的学习能力、复杂问题归纳梳理能力
-追求极致的心态

工作职责


-参与公司深度学习推理引擎、AI编译器的架构设计、开发和优化,确保领域内推理引擎技术的先进性
-参与多模态LLM、视频生成模型推理性能性能的极致优化,保持业界SOTA
-研究最近的推理优化技术,跟踪最新研究进展和技术趋势,提出改进和创新的想法,推动团队的技术发展,并应用到业务
-和团队一起攻克高性能、高并发、高可用性等各种不同技术场景下的技术挑战
包括英文材料
学历+
C+++
Python+
数据结构+
设计模式+
深度学习+
PyTorch+
CUDA+
相关职位

logo of xpeng
社招3年以上

1. 参与语音交互算法工程化工作(包括但不限于asr,nlp,tts,多模大模型)关联模块及端到端的架构设计和功能开发; 2. 多平台(如GPU,高通8155/8295芯片平台)的模型推理优化及加速;

更新于 2024-11-28
logo of bytedance
社招A217506A

1、大模型关键技术突破,构建AI应用开发平台核心竞争力,支撑共享引擎大模型业务快速推进和迭代; 2、跟踪安全大模型领域的前沿技术与行业动态,及时将新技术、新方法引入到公司的安全研发工作中,持续创新安全应用解决方案,保持公司在安全技术领域的竞争力; 3、深度参与深度学习大模型产品研发,工程优化和应用过程中的技术落地,重点关注大模型部署、对齐、模型评估 推理优化加速等。

更新于 2024-12-17
logo of didi
社招技术

1. 负责滴滴 AI 推理框架的架构设计,应用于多个场景(NLP, ASR, LLM) 2. 参与高性能算子的开发及优化,支持多个后端 3. 参与模型量化相关工具设计及开发工作 4. 参与深度学习图优化,编译优化,分布式推理等性能优化工作 5. 参与服务化框架开发,SDK 封装及功能开发

更新于 2025-09-15
logo of baidu
社招3年以上ACG

-负责AI Agent及相关智能应用的设计、开发和优化,打造高效、可靠的Agent系统 -深入探索大模型(如GPT、Claude等)的应用场景,优化Agent的决策、推理和交互能力 -主导RAG(检索增强生成)相关技术的研发,提升Agent的知识检索与生成质量 -研究并应用最新的AI技术(如多模态、强化学习等),提升Agent的智能化水平 -与产品、算法、工程团队紧密协作,推动AI Agent的落地和规模化应用 -关注行业前沿技术动态

更新于 2025-08-26