美团【转正实习】大模型推理引擎研发工程师
实习兼职核心本地商业-基础研发平台地点:北京 | 上海状态:招聘
任职要求
1.熟练掌握CUDA编程、C++编程,数据结构和算法知识; 2.熟悉TVM或TensorRT或FastTransformer等推理优化框架; 3.熟悉LLM大模型相关背景知识,有相关方向的研究经验和产出。 岗位亮点 1.紧跟…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责LLM大语言模型的推理优化; 2.负责机器学习引擎的编译优化工作; 3.负责模型稀疏化和模型量化工作。
包括英文材料
CUDA+
https://developer.nvidia.com/blog/even-easier-introduction-cuda/
This post is a super simple introduction to CUDA, the popular parallel computing platform and programming model from NVIDIA.
https://www.youtube.com/watch?v=86FAWCzIe_4
Lean how to program with Nvidia CUDA and leverage GPUs for high-performance computing and deep learning.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
数据结构+
https://www.youtube.com/watch?v=8hly31xKli0
In this course you will learn about algorithms and data structures, two of the fundamental topics in computer science.
https://www.youtube.com/watch?v=B31LgI4Y4DQ
Learn about data structures in this comprehensive course. We will be implementing these data structures in C or C++.
https://www.youtube.com/watch?v=CBYHwZcbD-s
Data Structures and Algorithms full course tutorial java
还有更多 •••
相关职位

实习技术
团队介绍: 作为搜狐媒体内容中心产品技术团队,我们聚焦AI与媒体融合创新,持续探索AI技术在内容生产、传播、商业化全链路的创新性实践。目前团队主要业务方向: 1、主攻品牌营销领域AI互动产品研发(线上H5/小程序+线下智能装置),通过创新交互模式助力客户品牌价值提升; 2、打造媒体内容AI智能化生产体系,研发媒体采编工具链与多模态内容引擎,持续提升内容生产效能; 3、建立新闻垂直领域AI能力评价标准,通过构建行业评测基准、专业数据集及领域适配模型,夯实AI技术在传媒场景的深度应用。 1、作为核⼼成员参与AI项目的设计与开发,构建⾯向媒体业务的AI应⽤和⼯具链; 2、负责全栈开发⼯作,涵盖AI服务的前端研发、后端研发、API设计及交互体验优化等; 3、参与AI模型的集成、部署和质量评测,提升媒体内容生产、运营、营销等环节的智能化⽔平; 4、团队项目⽬前处于快速演进阶段,⿎励创新和⼤胆尝试。
北京
实习蚂蚁集团2027
1. 参与AI Infra 基础设施平台或者面向金融、风控、营销、Web3、企业服务等AI应用场景的智能体(Agent)系统的设计、开发与优化; 2. 参与基于大语言模型(LLM)或多模态模型的智能体核心模块研发,包括但不限于任务规划、工具调用、记忆机制、对话管理、推理引擎等, 探索和实现智能体在复杂业务场景中的落地应用,如智能客服、自动化流程、决策辅助、数字员工等; 3. 参与AI Infra 平台系统架构设计和核心技术细节实现,帮助团队攻克各种技术难关,保障和提升平台稳定性; 4. 与算法、产品、数据及业务团队紧密协作,推动智能体系统的全链路端到端交付与迭代; 5. 跟踪前沿技术进展,通过AI Coding 持续提升系统智能化水平与工程效率。
北京|上海|杭州