小米大模型用户研究实习生
任职要求
1. 文学、哲学、心理学、数学、物理、化学、生物、医学、计算机、工程等相关领域,本硕博均可。 2. 热爱生活,知识面丰富,对用户体验…
工作职责
我们正在寻找专注于提升小米全系列产品中大模型应用体验的研究员,重点优化模型在知识百科、新闻时事、生活服务、学习办公、AI创作、营养健康、学科教育、AI编程、情感陪伴、智能家居等场景的理解与推理能力,推动大模型在复杂综合问题上的表现,使其能够解决类似人类高水平考试中的问题。 岗位职责: 1. 研究用户需求:研究用户在知识百科、新闻时事、生活服务、学习办公、AI创作、营养健康、学科教育、AI编程、情感陪伴、智能家居等场景的真实需求,明确对大模型能力的要求。 2. 开发科学基准测试:定义接近用户真实体感的体验评估标准,构建科学的评测方法,衡量模型在复杂用户场景中的表现。 3. 训练数据集构建:收集和整理高质量的科学数据,以支持模型强化学习训练。
我们正在寻找专注于提升小米全系列产品中大模型应用体验的研究员,重点优化模型在知识百科、新闻时事、生活服务、学习办公、AI创作、营养健康、学科教育、AI编程、情感陪伴、智能家居等场景的理解与推理能力,推动大模型在复杂综合问题上的表现,使其能够解决类似人类高水平考试中的问题。 岗位职责: 1. 研究用户需求:研究用户在知识百科、新闻时事、生活服务、学习办公、AI创作、营养健康、学科教育、AI编程、情感陪伴、智能家居等场景的真实需求,明确对大模型能力的要求。 2. 开发科学基准测试:定义接近用户真实体感的体验评估标准,构建科学的评测方法,衡量模型在复杂用户场景中的表现。 3. 训练数据集构建:收集和整理高质量的科学数据,以支持模型强化学习训练。
【职位前言】 DeepSeek-R1的发布给世界带来了不小的震撼,更令人敬佩的是,无论是赶超OpenAI o1的模型效果,还是节省百万美元成本的工程优化,这背后的原理与实现都在官方发布的技术报告和开源项目中一一公开。 大语言模型的前沿研究将不再只是少数巨头才玩得起的项目,更多的研究者可以入局这场对人工智能探索的新征程。 如果您对模型背后的工程优化充满好奇(FP8混合精度训练、分布式专家并行等),想深入了解并上手实践,但又没有合适的计算资源与明确的优化目标,又对模型 post-training(GRPO强化学习、模型蒸馏等等)跃跃欲试,但又没有明确的应用场景和数据资源—— 那不妨来网易云音乐,和我们搭上这趟时代的列车,一起拆解硬核技术,聚焦于音乐业务中的搜索、推荐、广告场景,探索大模型的应用落地与高效部署。 【职位描述】 1、参与大模型在后训练和推理工程中的性能优化,结合底层硬件特性从混合精度训练、矩阵计算加速、注意力机制计算优化、GPU分布式并行等方面提升工程效率; 2、通过强化学习、模型蒸馏等方式,构建音乐领域具有 CoT 推理能力的大语言模型,应用于搜索、推荐、广告等业务场景。 【我们拥有】 1、音乐行业内海量用户独一无二的数据资源; 2、贴近实际的业务场景,让 idea 落地并发挥价值; 3、可观的计算资源,性能上还有极大的空间待与你一同挖掘; 4、鼓励创新探索、倡导悉心钻研、宽松融洽多元的团队氛围; 5、成果转换的支持,合作完成项目及论文,助力未来的职业发展。
我们是网易云音乐算法团队,专注于行业领先的搜索或者推荐算法,我们致力于通过技术赋能云音乐各项业务,通过社区广场推荐,提升用户体验,产生商业化价值。 在这里你可以: 1、参与云音乐各场景相关的AIGC算法应用,使用NLP、多模态、LLM等技术,优化包括多模态内容理解、大模型交互式对话、大模型AI创作生成等业务应用的效果提升; 2、参与云音乐创新业务相关的算法优化,使用业界领先的深度学习、强化学习、图模型等,优化推荐、直播、声音、社交等业务的算法; 3、参与前沿的基础算法模型建设,包括继续预训练、视频生成微调,音乐生成训练等垂类基座模型的构建和应; 4、接触到亿级别海量、真实的用户数据,使用深度学习、强化学习、图模型等算法,发挥推荐的价值; 5、使用行业领先的大规模分布式机器学习平台,例如tensorflow等开源的工具,实现并不断优化推荐、搜索等算法。
-高级自然语言策略工程师,负责设计和优化基于大语言模型的产品策略落地,将前沿研究应用到真实业务场景中,为数百万用户提供卓越的文小言APP智能体验。 -策略设计与研发:基于大语言模型的核心产品策略设计与研发,制定技术路线图,推动创新解决方案落地 -模型训练与调优:基于RLHF等强化学习方法的大语言模型训练和精细化调优方案,提升模型在多场景下的表现 -自动化工具开发:构建和完善语料自动生成和智能标注系统,提升数据生产效率和质量 -用户行为分析:执行用户行为数据分析工作,构建用户意图识别和理解模型,优化产品决策机制和交互体验 -策略评估框架:建立科学的策略评估体系,包括离线评测和在线A/B测试方案,指导产品持续迭代优化 -跨团队协作:与产品、研发、设计等团队紧密协作,将先进NLP技术转化为产品竞争力,推动业务增长 -团队指导:指导初级工程师和实习生,提供技术指导和职业发展建议,提升团队整体技术水平