logo of meituan

美团【转正实习】大模型推理引擎研发工程师

实习兼职核心本地商业-基础研发平台地点:北京 | 上海状态:招聘

任职要求


1.熟练掌握CUDA编程、C++编程,数据结构和算法知识;
2.熟悉TVM或TensorRT或FastTransformer等推理优化框架;
3.熟悉LLM大模型相关背景知识,有相关方向的研究经验和产出。
岗位亮点
1.紧跟…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责LLM大语言模型的推理优化;
2.负责机器学习引擎的编译优化工作;
3.负责模型稀疏化和模型量化工作。
包括英文材料
CUDA+
C+++
数据结构+
还有更多 •••
相关职位

logo of sohu
实习技术

团队介绍: 作为搜狐媒体内容中心产品技术团队,我们聚焦AI与媒体融合创新,持续探索AI技术在内容生产、传播、商业化全链路的创新性实践。目前团队主要业务方向: 1、主攻品牌营销领域AI互动产品研发(线上H5/小程序+线下智能装置),通过创新交互模式助力客户品牌价值提升; 2、打造媒体内容AI智能化生产体系,研发媒体采编工具链与多模态内容引擎,持续提升内容生产效能; 3、建立新闻垂直领域AI能力评价标准,通过构建行业评测基准、专业数据集及领域适配模型,夯实AI技术在传媒场景的深度应用。 1、作为核⼼成员参与AI项目的设计与开发,构建⾯向媒体业务的AI应⽤和⼯具链; 2、负责全栈开发⼯作,涵盖AI服务的前端研发、后端研发、API设计及交互体验优化等; 3、参与AI模型的集成、部署和质量评测,提升媒体内容生产、运营、营销等环节的智能化⽔平; 4、团队项目⽬前处于快速演进阶段,⿎励创新和⼤胆尝试。

北京
logo of antgroup
实习蚂蚁集团2027

1. 参与AI Infra 基础设施平台或者面向金融、风控、营销、Web3、企业服务等AI应用场景的智能体(Agent)系统的设计、开发与优化; 2. 参与基于大语言模型(LLM)或多模态模型的智能体核心模块研发,包括但不限于任务规划、工具调用、记忆机制、对话管理、推理引擎等, 探索和实现智能体在复杂业务场景中的落地应用,如智能客服、自动化流程、决策辅助、数字员工等; 3. 参与AI Infra 平台系统架构设计和核心技术细节实现,帮助团队攻克各种技术难关,保障和提升平台稳定性; 4. 与算法、产品、数据及业务团队紧密协作,推动智能体系统的全链路端到端交付与迭代; 5. 跟踪前沿技术进展,通过AI Coding 持续提升系统智能化水平与工程效率。

北京|上海|杭州
logo of netease
实习网易元气

1. 跟进活动版本开发进度,协调QA完成基础功能测试 2. 按要求完成小型系统和新增功能设计,以及跟进功能落地 3.负责运营内容的开发和更新

更新于 2025-06-20广州
logo of netease
实习网易云音乐

1. 参与音乐推广内容策划、跟进推广的投放执行和沟通;  2. 持续监控推广效果,定期整理数据和反馈总结,输出歌曲推广方案建议;  3. 协助导师进行推广的复盘和分析; 4. 配合项目需求,完成导师布置的其他工作。

更新于 2025-07-18杭州