logo of bytedance

字节跳动多模态数据技术专家(视觉理解方向)-DMC

社招全职A52622地点:北京状态:招聘

任职要求


1、有智能对话类产品经验优先,有一定的代码基础,有心理学背景优先,了解视觉基础原理、接口和提示工程技术;
2、熟悉或亲身参与大模型训练、微调、大模型应用开发等经验,有PE能力优先;
3、能…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、基于视觉理解大模型打造的视频通话功能做相关的数据建设,负责智能对话类产品的场景构建、数据采集、风格制定,对结合视觉的对话类数据生产的质量和效率负责,紧密协同模型效果迭代;
2、依据视觉理解模型的能力场景,制定并持续优化数据生产的标准和流程,积极探索数据生产或模型效果提升的实验,获得客观严谨的结论并能优化数据生产流程;
3、能够用多种手段为标注工作提效,包括并不限于工具优化、PE撰写、标注方式创新等;
4、与算法团队、产品团队密切协作,深度理解背后的模型原理、算法逻辑,积极提供有价值的数据构造或生产的策略及建议;
5、输出与带教,协助团队其他非技术向员工,提升对多模态大模型的了解程度、教授实际应用技巧等,以辅助团队更好完成业务目标。
包括英文材料
大模型+
相关职位

logo of vivo
社招3年以上研发类

1. 负责多模态大模型在图像与视频理解方向的算法研发、优化与部署; 2. 深入研究并实践多模态大模型的微调技术,以适配特定业务场景; 3. 参与构建和优化大规模多模态数据集; 4. 跟踪最新技术进展,不断优化算法性能(精度、效率、泛化能力); 5. 与团队紧密协作,推动算法在产品中的有效落地;

更新于 2025-08-05杭州|深圳
logo of vivo
社招3年以上研发类

1. 负责多模态大模型在图像与视频理解方向的算法研发、优化与部署; 2. 深入研究并实践多模态大模型的微调技术,以适配特定业务场景; 3. 参与构建和优化大规模多模态数据集; 4. 跟踪最新技术进展,不断优化算法性能(精度、效率、泛化能力); 5. 与团队紧密协作,推动算法在产品中的有效落地;

更新于 2025-07-30深圳
logo of amap
社招2年以上技术类-算法

围绕高德的核心业务场景,研究大模型与推荐结合提升业务效果并落地,不限于LLM、多模态大模型SFT、RLHF、多模态理解、内容表征、推荐算法、行为序列建模、搜索算法。 团队介绍: 团队由国内外知名高校及主流互联网企业的资深专家组成,在顶尖期刊(如KDD、NeurIPS、ICLR、ICML、AAAI等)发表过多篇论文,是国内理论与应用实践相结合、应用算法创新的顶尖和超一流团队。

更新于 2025-09-25北京
logo of antgroup
社招2年以上技术类-算法

1、研究多模态模型预训练新范式,突破多模态对齐、跨模态推理、多模态数据挖掘和合成、效果评测等关键技术难题; 2、打造行业领先的算法能力:如视频问答、音视频交互等; 3、探索视觉理解大模型与音视频交互大模型技术的深度融合路径,构建支持图像、视频、语音多模态理解的通用大模型架构和大规模训练; 4、支持音视频交互推理加速框架建设,构建完善的音视频交互大模型数据链路,探索和细化不同的音视频交互模型的评估维度、方法和指标,落地评估系统,支撑基础大模型迭代和上线; 5、关注多模态/NLP/语音等方向的前沿技术,及时将新技术应用到产品中。

更新于 2025-12-23杭州