字节跳动多模态大模型算法工程师(本地生活方向)-国际化短视频
任职要求
1、硕士研究生及以上学历,计算机相关专业;扎实的编程能力,良好的算法与数据结构基础; 2、对机器学习、推荐系统或多模态模型具备浓厚兴趣,有较强的问题分析与解决能力; 3、熟悉至少一项相关领域(如机器学习、NLP、CV等),有推荐系统、内容理解、多模态建模或相关工作经验者优先; 4、具备良好的沟通能力与团队协作精神,乐于在全球化的技术团队中成长与挑战。
工作职责
1、参与国际化短视频产品的核心算法研发,重点负责多模态大模型的训练与优化,支撑视频推荐、本地生活服务、音乐推荐、图文理解等下游任务的实际落地,提升内容分发智能化水平; 2、结合业务场景需求,探索视觉、文本、音频等多模态信息的融合建模与对齐机制,提升内容理解与用户意图匹配能力,推动推荐系统向更深层次的语义理解演进; 3、应用强化学习技术解决多模态理解中的复杂建模与优化问题,包括多模态表示学习、跨模态对齐与跨语言泛化等关键挑战,持续提升线上效果; 4、参与算法平台与模型训练体系建设,提升多模态大模型的训练效率、资源利用率与部署稳定性,加速技术成果在全球化业务中的应用落地。
团队介绍:直播团队负责为抖音集团旗下产品提供直播服务。团队负责直播平台技术和直播业务研发,打造灵活稳定的直播服务平台,为用户提供优质直播体验,支持电商、本地生活、游戏、节目、多人互动等不同类型的业务场景。直播业务发展迅猛,处于行业头部地位,业务发展空间巨大。现在加入我们,和优秀的人一起做有挑战的事,你的技术与创意将影响亿级用户,激发创意和丰富生活。 1、负责抖音直播&社交相关场景的大语言模型/多模态大模型的算法研发,包括智能对话、语音交互、视频理解等工作,使用领域预训练、后训练等技术构建领域大模型; 2、负责抖音研发内部提效场景的智能体优化,聚焦知识构建、复杂规划、代码生成等关键场景,打造面向软件研发全生命周期的AI工程师; 3、持续跟踪大模型领域的最新技术进展,推动前沿技术的产品化落地。
团队介绍:TikTok内容生态算法团队立足于平台海量用户和短视频内容,利用多模态、LLM/MLLM、NLP&CV等技术,负责对各类内容做分析、加工、生成等内容层操作,内容形态包括但不限于短视频、图文、全网热点页面、客服对话等,产出内容理解特征、大模型生成中间页、全网热点发现&理解能力以及智能客服系统。 同时在TikTok供给侧提供面向全平台的创作灵感个性化推荐能力。 在这里,有上百个语种,NLP/LLM等技术面临多语种挑战。 在这里,有海量短视频内容,MLLM及多模态技术有更多应用场景。 平台用户量大,各项业务如本地生活、搜索等都处于高速发展期,有大量实际落地和应用场景。 1、参与TikTok业务中的NLP/CV基础算法相关研发工作,深度理解业务,解决和跟进一线业务问题; 2、与产品运营团队紧密协作,在热点挖掘、本地生活等业务方向持续迭代优化算法效果,达成业务目标; 3、结合业务场景挑战,跟踪前沿领域研究成果,推动技术创新在业务场景的深度应用,包括但不限于热点发现/信息抽取与结构化/多模态/大模型/文本生成/检索与相关性等算法领域。
1. 负责大模型在客服业务场景下关键能力的应用研发,包括但不限于知识和指令遵循、深度推理、反思和评估等能力的优化和落地。 2. 负责多模态大模型的应用实践,特别是语音文本融合的多模态大模型的应用。 3. 研发和优化智能体的function call、多智能体间协调,使其能够高效、准确地调用内部和外部工具,扩展智能体的应用边界。 4. 深入理解本地生活服务业务场景,抽象业务所需的大模型基础能力深度优化,推动相关技术在实际业务中的应用。 5. 与工程团队紧密合作,推动算法模型的工程化落地,包括模型压缩、加速、部署和监控等环节。 6. 紧密跟踪业界前沿技术,结合业务需求进行预研和技术储备,保持团队的技术竞争力。