logo of bytedance

字节跳动文本大模型数据探索运营实习生-内容质量与数据服务平台

实习兼职A163611A地点:北京状态:招聘

任职要求


1、本科及以上学历在读,计算机、数学、数据科学、哲学、逻辑学等专业优先;
2、计算机、数学背景同学技能基础,精通至少一门编程语言(Python/C++/Java等),数据结构算法基础扎实,代码规范良好,熟练使用至少一种深度学习框架(PyTorch/TensorFlow等),熟悉模型训练、调参与基础部署流程,熟悉主流开源大模型与生态(如DeepSeek/Qwen/LLama等),具备Prompt设计、RAG搭建与微调相关经验,在以下至少一个方向具备深入研究与落…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。

1、参与大语言模型在垂直领域的数据生产与优化,负责通用主题问题的理解与逻辑拆解,明确任务目标与关键信息,针对模型生成的初始回答,识别逻辑漏洞或语言不通顺之处,通过自动化手段进行高质量改写,确保标注数据的准确性与实验有效性;
2、从用户视角理解并处理复杂开放式问题,具备良好的问题拆解与关键词提取能力,逻辑清晰地补全思考链路,能够自然流畅地组织信息,进行事实、推理、观点的区分与表达,擅长识别模型输出中的逻辑不一致与语义偏差;
3、跨团队协作,与算法、产品等团队紧密配合,深入理解垂类方向用户需求及模型特性,不断迭代标注标准,提升数据质量与准确性;
4、关注行业动态与先进实践,持续关注大语言模型的发展趋势,探索数据生产在模型能力提升中的作用,学习并应用行业先进的数据生产方法于数据生产工作中。
包括英文材料
学历+
数据科学+
Python+
C+++
Java+
数据结构+
算法+
还有更多 •••
相关职位

logo of ke
社招5年以上用户技术中心

岗位职责: 1、负责 AI Agent 系统的设计、开发和优化、开发和完善基于大语言模型 (LLM) 的智能体系统,提升 Agent 的自主决策和任务执行能力; 2、负责生成式大模型指令意图理解相关工作,整体提升大模型的多轮对话指令理解能力和性能; 3、设计并实现 Agent 的工具使用接口,实现与各类外部系统和 API 的集成编排; 4、负责大模型在检索、推荐方面的系统设计实现和优化,探索Agent、RAG、领域模型调优等相关技术在业务场景落地; 5、具备模型知识、幻觉机制探究,提升模型知识水平、降低模型幻觉率; 6、能够基于开源模型,设计和开发算法,对模型进行微调,优化其参数和结构,以提高模型的泛化能力和准确性; 7、深入调研AI领域相关的前沿技术,跟踪业内大模型领域的最新进展,并寻求将最新技术应用到产品的可能性。

更新于 2025-04-02北京
logo of ctrip
社招5年以上住宿业务AI &

我们正在寻找一位具有AI智能化及内容算法经验的算法团队负责人。负责领导团队开发前沿技术,推动旅游领域知识的构建,支持内容产品的分发和AI Agent结合的创新应用探索,提升公司产品的智能化水平。 : 领导并管理内容算法团队,制定技术战略和发展方向,推动知识构建、知识编译、知识分发、探索LLM等创新NLP技术与Agent业务的结合。 1、负责基础NLP相关算法研发,面向但不限于:预训练,文本理解,同义词挖掘,实体识别,term权重分析,属性词挖掘 2、结合NLP和深度学习技术,推动领域知识的构建与优化,制定各环节Benchmark及衡量标准, 跟进业界先进大模型、多模态技术的应用及改进 3、发现并解决推荐分发场景中的意图识别、排序模型、相关性等方向的问题,召回策略和召回模型的优化,开发先进和高性能的召回算法 4、与产品、数据、工程等跨职能团队协作,推动技术落地和产品迭代。 5、负责团队成员的技术指导和能力提升,推动团队技术文化的建设。

更新于 2025-04-01上海
logo of kuaishou
社招1-3年J0011

1、参与亿级用户规模视频推荐和交互产品推荐,提升用户体验、时长、留存等核心指标; 2、分析海量用户行为数据和视频数据,挖掘用户侧和item侧有效特征,提升推荐效果; 3、参与机器学习、深度学习领域研发工作,不限于网络模型设计与优化; 4、探索多模态大模型的前沿技术,通过加强视频和文本的理解,提升产品体验和业务效果。

更新于 2026-03-31北京
logo of baidu
社招ACG

-负责落地LLM在内容理解场景中的应用,负责文本内容理解与审核场景端到端效果优化与提升 -重点研究以小尺寸大语言模型相关的技术,包括但不限于数据建设、指令微调、模型优化、模型蒸馏等 -提升数据构建合成、模型推理等能力;构建大小模型融合的推理系统,提升模型在理解与审核场景中的效果 -持续探索跟进学术与业界前沿进展,探索包括但不限于CoT、RAG、强化学习微调等能力并落地

更新于 2025-10-11北京