logo of netease

网易算法工程实习生(大模型方向)

实习兼职网易云音乐地点:杭州状态:招聘

任职要求


1、2026年及之后毕业的全日制在校生,具备一定的数理基础,对深度学习、大语言模型的基本原理有一定的了解;
2、具备Python编程经验,熟悉TensorflowPytorch等主流深度学习框架(加分项:熟悉C++CUDA 编程);
3、具备英语专业文献的阅读和写作能力;
4、对新知识&新技术充满好奇,敢于钻研,善于合作,乐于交流;
5、Base杭州,近期可入职,至少实习4-6个月。

工作职责


【职位前言】
DeepSeek-R1的发布给世界带来了不小的震撼,更令人敬佩的是,无论是赶超OpenAI o1的模型效果,还是节省百万美元成本的工程优化,这背后的原理与实现都在官方发布的技术报告和开源项目中一一公开。
大语言模型的前沿研究将不再只是少数巨头才玩得起的项目,更多的研究者可以入局这场对人工智能探索的新征程。

如果您对模型背后的工程优化充满好奇(FP8混合精度训练、分布式专家并行等),想深入了解并上手实践,但又没有合适的计算资源与明确的优化目标,又对模型 post-training(GRPO强化学习、模型蒸馏等等)跃跃欲试,但又没有明确的应用场景和数据资源——
那不妨来网易云音乐,和我们搭上这趟时代的列车,一起拆解硬核技术,聚焦于音乐业务中的搜索、推荐、广告场景,探索大模型的应用落地与高效部署。

【职位描述】
1、参与大模型在后训练和推理工程中的性能优化,结合底层硬件特性从混合精度训练、矩阵计算加速、注意力机制计算优化、GPU分布式并行等方面提升工程效率;
2、通过强化学习、模型蒸馏等方式,构建音乐领域具有 CoT 推理能力的大语言模型,应用于搜索、推荐、广告等业务场景。

【我们拥有】
1、音乐行业内海量用户独一无二的数据资源;
2、贴近实际的业务场景,让 idea 落地并发挥价值;
3、可观的计算资源,性能上还有极大的空间待与你一同挖掘;
4、鼓励创新探索、倡导悉心钻研、宽松融洽多元的团队氛围;
5、成果转换的支持,合作完成项目及论文,助力未来的职业发展。
包括英文材料
深度学习+
Python+
TensorFlow+
PyTorch+
C+++
CUDA+
相关职位

logo of mi
实习

工作内容:语言大模型技术的研究和应用 负责大模型方向技术的研究和应用,构建汽车垂域智能系统,工作内容包括以下三个方向: a. 负责追踪大模型学术进展,预研前沿技术问题,打造行业领先技术影响力 b. 负责根据业务场景,抽象技术问题,预研和实现大模型技术,赋能整车业务 技术方向包括但不限于: 1. 模型架构、预训练方法、高效微调、模型评估及迭代 2. 知识增强、工具增强、AI Agent、RAG 3. 安全、时效性等问题解决 4. 训练和推理加速、模型量化、端测落地 5. 大模型核心能力提升,包括理解能力、知识能力、推理能力、生成能力和语言能力等 6、制定相关规范并形成项目管理文档。

更新于 2025-08-18
logo of mi
实习

1.负责AIGC 大模型方向的模型训练,协助项目落地 2.跟进业界 SOTA 底层视觉-AIGC相关技术进展

更新于 2025-03-25
logo of mi
实习

工作内容:语言大模型技术的研究和应用 负责大模型方向技术的研究和应用,构建大规模通用智能系统,工作内容包括以下三个方向: a. 负责追踪大模型学术进展,预研前沿技术问题,打造行业领先技术影响力; b. 负责根据业务场景,抽象技术问题,建立大模型智能体解决方案; c . 负责将解决方案落地应用在具体业务场景,打造卓越的用户体验。 技术方向包括但不限于: 1. 全量微调、高效微调、模型评估及迭代; 2. 知识增强、工具增强、AI Agent、拟人化; 3. 幻觉、安全、时效性等问题解决; 4. 大模型核心能力提升,包括理解能力、知识能力、推理能力、生成能力和语言能力等。

更新于 2025-02-11
logo of alibaba
实习淘天集团研究型实

1. 跟进多模态大模型(vLLM)预训练、SFT、RLHF等技术,调研与跟进最新进展;负责多模态相关性大模型、多模态大模型稀疏检索和稠密模型,多模态大模型个性化预训练方向,以及多模态大语言模型的训练和推理加速; 2. 多模态大模型个性化预训练:研发个性化预训练模型,探索在训练样本、模型参数量等维度上scale-up能带来的收益,研究在电商搜索场景下, CTR和CVR 模型中用户动线特征的挖掘和应用,包括用户行为模型的获取、特征设计、结构优化等个性化建模; 3. 多模态大模型的训练和推理加速:协助研究和开发多模态大语言模型的加速技术,包括但不限于量化、剪枝和蒸馏,以及数据特征和调度优化;实现和优化多模态大模型推理框架,以提高推理速度和效率;与工程团队合作,解决机器学习模型在部署过程中的性能问题; 4. 多模态大模型相关性模型:研发基于多模态大模型的相关性标注和评测大模型,应用到体验实验评测、体验监控、离线数据标注、线上相关性判断等方向; 5.多模态大模型稀疏检索和稠密模型:研究方向包括不限于:电商词表生成、多模态稀疏词表和稠密表征技术、LLMs幻觉缓解等问题。

更新于 2025-05-06