美团大模型语料实习生
任职要求
1、本科及以上学历,汉语言文学、新闻传播、语言学等相关专业优先。
2、具有丰富的旅行经历优先,对旅行目的地和行程规划有深度了解和热情。
3、优秀的文案能力和文本敏感度,善于…工作职责
1、深度参与酒旅AI大模型的运营工作,包括语料的整理、标注、质量把控及外包团队对接。 2、参与大模型理想集撰写与效果评估,持续优化模型输出以贴合用户需求。 3、进行酒旅场景下的系统性测评,包括但不限于效果评测、问题分析、迭代建议输出。 4、建设和维护高质量大模型语料库,确保数据的准确性、完整性与时效性。
-高级自然语言策略工程师,负责设计和优化基于大语言模型的产品策略落地,将前沿研究应用到真实业务场景中,为数百万用户提供卓越的文小言APP智能体验。 -策略设计与研发:基于大语言模型的核心产品策略设计与研发,制定技术路线图,推动创新解决方案落地 -模型训练与调优:基于RLHF等强化学习方法的大语言模型训练和精细化调优方案,提升模型在多场景下的表现 -自动化工具开发:构建和完善语料自动生成和智能标注系统,提升数据生产效率和质量 -用户行为分析:执行用户行为数据分析工作,构建用户意图识别和理解模型,优化产品决策机制和交互体验 -策略评估框架:建立科学的策略评估体系,包括离线评测和在线A/B测试方案,指导产品持续迭代优化 -跨团队协作:与产品、研发、设计等团队紧密协作,将先进NLP技术转化为产品竞争力,推动业务增长 -团队指导:指导初级工程师和实习生,提供技术指导和职业发展建议,提升团队整体技术水平
本课题的研究目标是打造行业领先的多语言能力强化的大语言模型,结合业务海量的多语言互译语料,以及平台生活化特色的笔记评论数据,利用数据合成、RL冷启训练、SFT和RLHF等技术,实现: 1、在小红书多语言大模型翻译场景取得领先效果; 2、多语言场景下,AI搜索的检索和生成技术。
-参与Qianfan-VL多模态模型训练工作,负责图像、视频与文本模态的对齐和指令微调数据构造与清洗,模型实验 -构建优质代码数据语料库,通过检索生成结合执行环境自动验证的方式构造合成数据,通过持续预训练、强化学习等方式训练精专代码大模型 -跟进并探索前沿的模型范式,研究样本质量/数量对模型效果的影响,摸索更高效、低成本的蒸馏方案,研究RL在特定需求场景下的适用性 -深刻理解模型训练、推理的性能瓶颈,通过底层优化提升训练、推理性能 -研究方向(新增数据策略方向): 多模态大模型预训练/后训练数据清洗与合成 多模态推理场景强化 多模态教育、解题场景增强 复杂指令遵循 Agent场景数据构建 复杂场景下的代码提升