优酷优酷-大语言模型算法工程师(创作)-北京
任职要求
1、具备百亿参数大语言模型训练经验优先;熟悉数据工程,预训练,对齐调优经验优先 2、良好的数学能力,基础数学知识优异者优先 3、…
工作职责
1. 负责大语言模型预训练,SFT,RL相关工作
1. 负责垂类大模型的数据构建、指令微调、偏好对齐和模型优化工作; 2. 负责垂类大模型在业务场景中的应用落地,包含但不仅限于客服、搜索、推荐、创作和对话等领域; 3. 负责Agentic AI的服务部署,服务性能测试和优化,确保算法的准确性和效率都有所提升; 4. 协同产品和工程团队进行大语言模型能力的产品化和工程化、持续迭代并完成商业闭环;
1、发现优化大模型的简单、普适的想法,并应用到各个规模的模型中提升效果; 2、推进数据建设、指令微调、偏好对齐、继续预训练等模型优化方面的工作,提高模型质量和适应性; 3、探索复杂指令、长上下文、多轮对话下,大模型更为复杂的理解、推理和生成能力; 4、基于语言处理、内容创作、教育Tutor、角色扮演、复杂Agent、AI搜索和工具、代码助手等服务和应用优化模型效果; 5、推进大模型效果评估,尤其是复杂场景(多轮对话、开放领域)评估集建设和自动化评估能力建设; 6、深入研究和探索大模型在ToB企业服务中的更多使用场景,拓展模型的应用范围,如搜索、推荐、广告、创作、客服和办公等各类场景。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式。主要工作方向包括: 1、研究AI大模型的关键能力,通过技术愿景来驱动研究工作,包括大模型的学习、记忆、推理、规划、感知等长期话题; 2、尽情探索探索超大规模模型,致力于实现极致的系统优化; 3、深入参与数据建设、大规模预训练、指令微调、偏好对齐、模型优化等关键工作; 4、大力推动大模型应用落地,为社会创造福祉。