夸克算法实习生-大模型应用-专业搜索方向
任职要求
1. 具备出色的编程与工程实现能力,精通至少一门主流开发语言(如 C/C++、Java、Python 等); 2. 在自然语言处理、计算机视觉、多模态建模或通用人工智能等方向具有良好学术基础与实践能力,熟悉深度学习主流框架(如 PyTorch、TensorFlow)…
工作职责
1. 负责大模型核心技术研发,包括专业数据整理、大模型检索、垂域SFT、RLHF等,持续追踪和应用领域最新技术进展; 2. 负责大模型应用技术探索,包括深度思考、深度研究在多业务场景的落地研究。
1、负责大规模预训练模型在全网百亿级网页搜索引擎的定向优化及落地工作,主要在上层排序方向以及大模型在搜索中落地进行探索应用。 2、基于海量用户行为数据以及人工标注数据,结合自然语言处理、性能优化、数据挖掘、机器学习等前沿技术,支持prompt工程、LLM微调、LLM强化学习等工作。 3、研究方向包括但是不限于大规模预训练技术、文本生成、模型蒸馏/窃取、强化学习等。
1、负责大规模预训练模型在全网百亿级网页搜索引擎的定向优化及落地工作,主要参与查询理解和搜索召回以及大模型在搜索中落地进行探索应用。 2、基于海量用户行为数据以及人工标注数据,结合自然语言处理、性能优化、数据挖掘、机器学习等前沿技术,支持prompt工程、LLM微调、LLM强化学习等工作。 3、研究方向包括但是不限于大规模预训练技术、文本生成、模型蒸馏/窃取、强化学习等。
【职位前言】 DeepSeek-R1的发布给世界带来了不小的震撼,更令人敬佩的是,无论是赶超OpenAI o1的模型效果,还是节省百万美元成本的工程优化,这背后的原理与实现都在官方发布的技术报告和开源项目中一一公开。 大语言模型的前沿研究将不再只是少数巨头才玩得起的项目,更多的研究者可以入局这场对人工智能探索的新征程。 如果您对模型背后的工程优化充满好奇(FP8混合精度训练、分布式专家并行等),想深入了解并上手实践,但又没有合适的计算资源与明确的优化目标,又对模型 post-training(GRPO强化学习、模型蒸馏等等)跃跃欲试,但又没有明确的应用场景和数据资源—— 那不妨来网易云音乐,和我们搭上这趟时代的列车,一起拆解硬核技术,聚焦于音乐业务中的搜索、推荐、广告场景,探索大模型的应用落地与高效部署。 【职位描述】 1、参与大模型在后训练和推理工程中的性能优化,结合底层硬件特性从混合精度训练、矩阵计算加速、注意力机制计算优化、GPU分布式并行等方面提升工程效率; 2、通过强化学习、模型蒸馏等方式,构建音乐领域具有 CoT 推理能力的大语言模型,应用于搜索、推荐、广告等业务场景。 【我们拥有】 1、音乐行业内海量用户独一无二的数据资源; 2、贴近实际的业务场景,让 idea 落地并发挥价值; 3、可观的计算资源,性能上还有极大的空间待与你一同挖掘; 4、鼓励创新探索、倡导悉心钻研、宽松融洽多元的团队氛围; 5、成果转换的支持,合作完成项目及论文,助力未来的职业发展。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式; 2、优化&创新RLHF算法训练效率与模型泛化能力; 3、Long CoT技术的实现和应用; 4、多模态大模型(文本、图像、语音)的Posttraining算法; 5、构建高质量、多领域的数据合成方法; 6、探索LLM在情感对话、创作等场景的应用。