理想汽车多模生成算法实习生-北京/杭州
本课题的研究目标是: 1、研究如何充分用好文本、图片、视频等各个模态的有效信息,进行高效的多模态数据表征和联合建模,能够更加高效的从各个模态中学习有效信息; 2、探索多模数据如何才能更高效的学习,多模数据如何对文本智能能力有提升,探索理解和生成的联合建模如何进一步提高多模态模型的能力上限。
【岗位亮点】 顶会论文直通车:我们鼓励并全力支持你将研究成果发表到CVPR、NeurIPS等顶级会议,资深技术人员全程指导,算力充足。 核心业务组:智能创作发布,直接影响用户体验,专注于将前沿多模态大模型、AIGC 技术与小红书发布核心业务深度融合。转正机会大。 前沿探索与创新:聚焦多模-态大模型(MLLMs)前沿,在 多模态指令微调、多模态检索、个性化文案生成、RAG 等方向中选择你最擅长或最感兴趣的,提出并实现你的创新想法。 从想法到落地:负责从算法设计、实验验证到模型优化的全流程,用严谨的实验和数据说话,推动研究课题取得突破。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:TikTok内容生态算法团队立足于平台海量用户和短视频内容,利用多模态、LLM/MLLM、NLP&CV等技术,负责对各类内容做分析、加工、生成等内容层操作,内容形态包括但不限于短视频、图文、全网热点页面、客服对话等,产出内容理解特征、大模型生成中间页、全网热点发现&理解能力以及智能客服系统。 同时在TikTok供给侧提供面向全平台的创作灵感个性化推荐能力。 在这里,有上百个语种,NLP/LLM等技术面临多语种挑战。 在这里,有海量短视频内容,MLLM及多模态技术有更多应用场景。 平台用户量大,各项业务如本地生活、搜索等都处于高速发展期,有大量实际落地和应用场景。 1、负责TikTok的内容生态业务推荐算法工作,和产品、运营等团队紧密合作,深度理解TikTok推荐业务发展,共同制定长短期的业务目标; 2、深入参与到机器学习技术研究中,在解决具体问题的同时形成完整系统的工作方法,持续提升用户体验; 3、研究方向包含且不局限于:深度学习、图神经网络、多任务学习、排序学习、模型压缩和加速、多模态技术等,善于结合业务的实际问题来做好技术的探索和研究; 4、组织推进组内以及跨部门合作项目,帮助团队的进步和新人成长。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:TikTok内容生态算法团队立足于平台海量用户和短视频内容,利用多模态、LLM/MLLM、NLP&CV等技术,负责对各类内容做分析、加工、生成等内容层操作,内容形态包括但不限于短视频、图文、全网热点页面、客服对话等,产出内容理解特征、大模型生成中间页、全网热点发现&理解能力以及智能客服系统。 同时在TikTok供给侧提供面向全平台的创作灵感个性化推荐能力。 在这里,有上百个语种,NLP/LLM等技术面临多语种挑战。 在这里,有海量短视频内容,MLLM及多模态技术有更多应用场景。 平台用户量大,各项业务如本地生活、搜索等都处于高速发展期,有大量实际落地和应用场景。 1、负责TikTok的内容生态业务推荐算法工作,和产品、运营等团队紧密合作,深度理解TikTok推荐业务发展,共同制定长短期的业务目标; 2、深入参与到机器学习技术研究中,在解决具体问题的同时形成完整系统的方法论,持续提升用户体验; 3、研究方向包含且不局限于:深度学习、图神经网络、多任务学习、Learning to rank、模型压缩和加速、多模态技术等,善于结合业务的实际问题来做好技术的探索和研究; 4、组织推进组内以及跨部门合作项目,帮助团队的进步和新人成长。