logo of baidu

百度NLP 数据实习生(J91819)

实习兼职ACG地点:北京 | 成都状态:招聘

任职要求


-有较好的逻辑推理能力,语言表达能力,分析条理清晰
-会用 Excel,Word,文本编辑器等常用办公软件
-有海外留学经验优先,有数据标注经验优先,粤语、英语好优先

工作职责


-围绕大模型打造国际版的智能对话能力需要的数据,在指导下进行数据标注
-建设文档问答、业务式对话、表格问答等对话核心能力,在指导下进行多语种的数据标注
-分析模型效果问题和数据之间的关系,针对性调整数据情况
-分析数据格式和下游使用情况,提出能融入系统的标注格式,提出标注系统的有效需求
-能主动挖掘现有开源数据,任务数据,构造新的训练数据,如 long CoT 等
包括英文材料
Excel+
相关职位

logo of baidu
实习ACG

-围绕大模型打造次世代的智能对话能力,例如实体抽取,意图识别、上下文记忆,多对话引擎切换 -建设文档问答、表格问答、FAQ等基于知识的对话能力,如 NL2SQL、Agentic-RAG -建设新一代数字员工产品,熟悉智能体基座模型领域,有机会研发遵循SOP执行的营销对话智能体 -梳理业务场景的会话,整理成训练大模型需要的训练数据,优化大模型专项能力(数值计算、日期比较、任务规划、工具选择等) -探索高性能,低成本的对话实现,最大化客户价值

更新于 2025-08-15
logo of meituan
实习核心本地商业-基

数据构建与处理: 深入参与大模型训练数据的设计与构建,亲手处理包括但不限于文本数据,平行语料、图文交错、图生图、图像序列等多样化数据。负责数据的采集、清洗、标注和预处理工作,为模型训练提供高质量的数据基础 模型训练与调优:参与或主导SFT / RL等后训练探索,提升模型在各类下游任务中的实际应用能力 探索如何通过数据和训练策略,激发模型采样多模态token的能力,并将其应用于解决真实物理世界的问题,参与数据驱动模型能力提升的全过程

更新于 2025-08-07
logo of baidu
实习ACG

-跟踪业界评估平台与工具趋势,能提出先进的评估指标、产品功能、实现方案等,帮助各方更准确理解评估结果 -负责评估产品的设计与持续迭代,深度调研用户需求,提升评估平台的易用性和科学性 -能系统梳理评估全流程,包括样本管理、评测执行、结果可视化、趋势对比和多维度分析等核心功能 -跟进行业领先的评估研究方向,推动开发团队高效的功能落地

更新于 2025-07-08
logo of bytedance
实习A178635

日常实习:面向全体在校生,为符合岗位要求的同学提供3个月以上的项目实践机会。 团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、负责为豆包大模型提供理科竞赛级(数学/代码/理科...)知识的数据工作,包括标准/方法的设计、数据的生产和检验; 2、评价模型效果,并调整优化竞赛问题的整体解答思路,判断解答的优缺点; 3、通过模型&人工结合的方式,设计适用于大模型的复杂逻辑推理的数据生产方法; 4、与研发工程师协作,讨论确定现状和问题,明确下一步提升模型推理等能力的方案。

更新于 2025-02-17