logo of bytedance

字节跳动VLM数据运营实习生(基础模型)-大模型数据服务中心

实习兼职A255593地点:北京状态:招聘

任职要求


1、本科及以上学历在读,计算机科学、人工智能、数学、物理等相关理工科专业;
2、具备大模型训练、微调、应用开发或网页爬取等相关技术经验者优先;拥有扎实的计算机网络、多线程等知识基础,能熟练运用Python及Pandas、NumPy等三方库完成数据处理工作,熟悉视觉基础原理、接口技术及提示工程,有LLM/VLM标注方案构建经验者优先;
3、对前沿科技有强烈探索欲,主动追踪行业最新论文与研究成果,热衷于…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:大模型数据服务中心,是抖音集团旗下为大模型业务提供数据、评估、运营等专业解决方案的团队;
主要承接大模型数据生产、大模型评估及运营相关的业务,与研发、产品等团队紧密合作,在预训练、数据监督微调、模型强化学习、模型能力评估、产品运营等大模型全链路数据环节,共同推动模型能力持续提升与应用。

1、主导核心方向数据生产全流程管控,对数据质量与交付效率负总责,紧密联动模型迭代环节,确保数据供给与模型效果优化同频共振;
2、结合视觉理解模型的核心能力场景,制定科学规范的数据生产标准与流程,并持续迭代优化;主动设计并落地数据生产效率提升、模型效果优化相关实验,输出客观严谨的结论并反哺流程升级;
3、探索并落地多元化标注提效方案,包括但不限于标注工具优化、提示工程(PE)撰写、Agent自动化标注搭建、标注模式创新等,提升数据生产效能;
4、深度协同算法、产品团队,精准理解模型原理与算法逻辑,针对性输出数据构造、生产策略等专业建议,助力打通“数据-模型-效果”的闭环链路;
5、承担团队知识输出与带教职责,协助非技术向成员提升大语言模型相关认知与实际应用技能,赋能团队整体业务目标达成。
包括英文材料
学历+
大模型+
多线程+
还有更多 •••
相关职位

logo of bytedance
实习A249081

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:我们是智能服务团队,团队负责互娱业务的泛体验、泛安全问题挖掘和业务赋能,为抖音/直播/剪映/醒图/本地生活等业务,提供服务化与智能化解决方案。 团队拥有工程(FE/Server)、数据(数据工程、数据科学)、算法(大模型、NLP、CV、推荐)、产品经理等多种职能岗位,可以高效自闭环进行智能平台类产品的设计研发,具有多个公司级影响力的智能化平台产品成功落地经验。 团队年轻向上,打造工程师文化,团队年度输出了50+篇专利,10+篇行业会议分享。 1、负责字节跳动效率领域各业务场景下,进行算法应用研究与开发落地工作,业务场景包括但不限于抖音用户体验优化/智能运营/智能客服等; 2、跟踪大模型方向的最新算法研究成果,用以持续提升业务应用效果,研究方向包括但不限于模型CT、Post-training、AI Agent等技术; 3、整理研究数据,撰写技术报告、发表研究论文和申请专利; 4、深度参与产品研发项目,和产品经理/业务研发/业务质量/运营等同学密切配合,提高项目整体效率和收益。

更新于 2023-08-22深圳
logo of bytedance
实习A256383A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、深入理解AI大模型,推动Agent、VLM、LLM的数据合成/数据有效性/模型评估等关键主题的研究并撰写论文; 2、针对大模型的突出问题,与产品研发、数据、评估团队协作,将科研成果应用到实际业务场景、数据标准、策略迭代、数据生产自动化等方面; 3、参与Agent评估集的设计与构建,提升模型在Agent应用场景的表现; 4、通过代码和提示词工程(PE),完成数据挖掘、预处理、数据分析、链路搭建等任务。

更新于 2025-08-15北京
logo of didi
社招技术

公司介绍 滴滴于 2016 年组建自动驾驶技术研发部门,致力于打造世界领先的 L4 级自动驾驶技术,通过科技让出行更安全、更高效。我们相信,将自动驾驶技术部署在共享出行车队中,将创造最大的社会价值。依托滴滴在出行领域的 先进技术、海量数据、丰富经验和完整的出行平台生态,我们正在打造并运营世界领先的自动驾驶 Robotaxi 车队,推动自动驾驶在城市复杂交通场景中的规模化落地。 职位描述 作为感知团队的一员,你将与国内外顶尖人才一起,研究和开发自动驾驶领域的前沿算法,直接赋能 L4 Robotaxi 的大规模部署。 你将面向真实城市道路场景中的多样化挑战,利用多模态传感器(LiDAR、Camera、Radar 等)设计、开发并优化感知算法,解决物体识别、障碍物检测、场景理解、意图预测与大模型赋能等核心问题。 在这里,你将有机会: 与中美两地的优秀工程师和科学家合作,参与世界级的技术竞争; 深入研究并推动最前沿的学术成果在产业中的落地; 在全球最大出行平台之一的业务场景中,实现科研成果的规模化应用。 主要方向与职责: 你将在以下方向中选定一个或多个方向深入负责,并承担从研发到落地、从算法到系统的端到端职责: (一)物体识别与跟踪 设计并实现基于 LiDAR / Camera / Radar 的多模态检测模型,识别车辆、行人、自行车、静态障碍物、交通标志等 提升精度、召回率与抗扰性(抗遮挡、夜间、恶劣天气、长尾类别) (二)通用障碍物识别 识别未知类别 /未训练类别的障碍物 基于异常检测 /开放类别识别的算法研究与工程实现 在非结构化环境(施工区域、道路损坏、落物等)中提升鲁棒性 (三)场景和意图理解 语义分割、实例分割、道路 /车道/交通标志/交通灯等结构物识别 场景理解,例如施工区域识别、可通行区域识别等 意图理解,例如行人动作识别、起步意图识别等 交互和事件识别,例如多方交互、交通规则冲突、非规范驾驶行为等 (四)感知大模型 /多模态 探索或应用预训练多模态大模型,将视觉、语言、地图/文本信息融合以增强感知能力 零样本 / 少样本 / 跨域泛化的策略研发 将大模型成果迁移到真实车队感知系统中,提升复杂场景下的鲁棒性 (五)模型评估、验证 构建完整的评估管道,包括离线评估 + 真实道路 + 模拟环境测试,支持回归检测与性能监控 指标体系设计 (Precision, Recall, IoU, latency, false positives rate 等)

更新于 2026-01-06北京
logo of meituan
社招3年以上核心本地商业-点

1.利用计算机视觉和人工智能技术,改进点评笔记、评价等多个点评创作产品的创作体验。 2.参与研发以计算机视觉和人工智能技术为核心的创新型内容玩法。 3.探索MLLM,LLM,VLM等相关算法前沿,应用于业务并解决实际业务问题。 4.负责对业务场景下相关技术问题进行分析、算法设计和上线,全面参与并推动各环节的高效运行,以实现持续的业务价值提升。 5.研究并开发智能Agent系统,优化用户与AI系统的交互体验。

更新于 2025-12-02北京|上海