logo of netease

网易大模型算法工程师

社招全职3-5年网易云音乐地点:杭州状态:招聘

任职要求


1. 精通 ​Python​ 和 ​C++/C,有扎实的Linux系统开发与性能优化经验。
2. 深入理解 ​LLaMA、Qwen​ 等大模型原理,熟练掌握 ​PyTorch​ 及 ​vLLM/TensorRT-LLM​ 等推理框架。
3. 具备GPU高性能计算能力,熟…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责公司自研文本大模型的推理系统研发,构建支撑拟真人虚拟人高并发实时交互的低延迟、高可用服务。
2. 攻关推理性能瓶颈,应用量化、KV Cache优化、投机解码等技术,在保障生成内容拟真度的同时大幅降低计算成 本。
3. 设计和优化分布式推理框架与弹性调度策略,确保服务在大规模用户访问下的稳定性与扩展性。
4. 进行CUDA内核与计算管线的深度优化,极致压榨GPU硬件性能。提高计算效率和 GPU 资源利用率。
包括英文材料
Python+
C+++
C+
Linux+
Llama+
还有更多 •••
相关职位

logo of pinduoduo
社招技术类

1、负责大模型设计和开发工作,包括模型设计、prompt优化、预训练、模型加速、数据集建设等; 2、结合业务需求,实现电商平台业务场景的智能化、自动化升级。

更新于 2026-04-16上海
logo of xiaohongshu
社招大模型

1、探索新一代大语言模型基座架构,完成扩散模型(diffusion model)在大语言模型的重塑,突破逐个token预测的方式,实现高效的推理模式,探索全新scaling law; 2、实现大模型训练的数据清洗、合成和评估;设计和实现大模型训练的AI Infra框架。

更新于 2025-11-20北京|上海
logo of meituan
社招核心本地商业-基

1、负责端到端开发新的 AI 功能,在整个 ML stack 中身兼数职。 2、负责训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 3、设计能够评估模型不同角度的评估方案。 4、负责大模型算法策略的设计、研发和优化,提升系统性能和稳定性

更新于 2025-06-19北京|上海
logo of tme
实习技术类

1. 负责腾讯音乐内容业务的AI技术研发,聚焦音乐生产与宣发等场景,构建核心技术体系,通过AI能力赋能音乐内容创作及服务等全流程; 2. 负责跟进行业内领先的AI音乐大模型技术,包括但不限于提出新的技术框架、改进现有的算法,持续提升相关技术指标 3. 负责参与和推动相关技术在业务上的落地。

更新于 2025-07-15深圳