logo of eleme

饿了么研发工程师-C++/大模型开发

实习兼职饿了么春季2026届实习生招聘地点:北京 | 上海状态:招聘

任职要求


1、计算机相关专业,具有扎实的工程算法基础,掌握各种编译、调试、性能分析工具;
2、极佳的工程实现能力,精通C/C++Python,熟悉常用的机器学习框架(如TensorFlowPyTorchvLLM等);
3、具备良好的计算机体系结构知识,理解异构GPU硬件的工作原理,了解异构计算(CUDA);
4、具备良好的沟通能力和团队合作精神,对新技术充满热情,具备强烈的责任感和学习能力。

工作职责


负责饿了么深度模型和超大规模训练推理,支持万亿规模的稠密及稀疏训练推理优化,结合分布式系统、高性能计算、异构计算,探索性能边界,支撑超大规模模型的训练及推理部署。我们关注超大规模模型训练及推理系统,为深度学习模型提供算力基座。

【岗位职责】
1、支持百亿-万亿规模的稠密模型、稀疏模型训练,在千卡集群上,实现多种分布式训练架构,以及强化学习训推一体复用等技术,消除各类大规模模型分布式训练的瓶颈;
2、支持大规模深度模型的推理部署性能优化,通过高性能计算、分布式计算、异构计算、编译优化等手段,在千卡集群上,解决大尺寸模型的推理性能瓶颈;
3、深入工程和算法协同,结合大规模推荐、大语言、多模态算法,探索适合业务的创新训练范式。
包括英文材料
算法+
C+
C+++
Python+
机器学习+
TensorFlow+
PyTorch+
vLLM+
CUDA+
相关职位

logo of baidu
社招ACG

-负责百度核心产品功能和架构开发 -负责核心技术算法的研究、实现和优化 -负责前瞻技术的跟踪调研和产品创新 -负责大模型开发工具链的研发

更新于 2025-07-08
logo of kuaishou
社招2年以上D11722

1、 研发业界领先的分布式深度学习训练框架,提供面向大规模稀疏数据的解决方案,服务于快手内部所有推荐类业务场景,包括 短视频、海外、广告、电商、直播等; 2、 多样的业务形态和庞大的业务规模 使得 框架的开发与优化 极富挑战性:万量级 GPU 卡,千亿量级样本,万亿量级参数,PB 量级训练数据; 3、工作内容包括但不限于: (1)参数服务器; (2)多机多卡分布式; (3)网络通信优化(以太网,RDMA); (4)GPU 优化(Kernel 优化,编译优化 等); (5)框架原生化(Tensorflow,PyTorch)。

更新于 2025-05-16
logo of alibaba
社招1-3年

1、负责人群定向引擎、广告投放引擎(互动)的系统架构设计,灵活支持新需求 2、参与大模型内置广告引擎的一体化探索、rocksdb高性能优化等技术创新,赋能业务新增长

更新于 2025-07-16
logo of baidu
社招3年以上MEG

-承担百度面向未来的AI Native应用iOS客户端的设计和开发工作,提升智能体应用体验,确保产品的高质量和稳定性 -协助团队成员进行技术研究和开发,与团队成员合作实现项目目标,不断提升自身技术能力和技术视野 -可参与大模型AI原生应用的调研、研发流程,有机会独立负责其中的一部分模块,为公司的业务发展提供技术支持 -持续跟进移动端和AI领域的最新技术发展和趋势,为团队提供有价值的技术输出,推动公司在移动端和AI领域的技术创新

更新于 2025-03-26