字节跳动多模态算法工程师-抖音内容理解
社招全职A74966地点:上海状态:招聘
任职要求
1、计算机/软件/人工智能/数学等相关专业的优先; 2、具有扎实的机器学习基础,对深度学习、大语言模型、多模态模型、生成式模型等内容理解与生成技术有深入的理解,数理功底扎实,自学能力强; 3、有扎实的编码能力,熟练使用相关机器学习框架和工程框架; 4、在多模态大模型领域有经验,在短视频、图文算法领域有经验者优先; 5、在计算机科学高水平会议和期刊如NIPS、ICML、CVPR、ICCV、ECCV、IJCAI、AAAI、KDD、SIGIR、WWW、ACL、PAMI、IJCV等发表过论文或有竞赛经验者优先。
工作职责
团队介绍:抖音内容理解团队负责抖音集团内容算法工作,业务覆盖抖音、今日头条、西瓜视频、剪映等业务,承接业务在内容理解、LLM应用、新业务方向探索等方向的工作。技术上涵盖了CV,NLP,音频,LLM等算法方向。团队承载业务需求同时还负责底层基础算法技术,负责为抖音各个技术方向提供长期有深度的技术支撑,推动如基础预训练模型、视频生成等基础技术研究等工作,并产出了较多的学术论文、技术报告、开源能力等工作。得益于抖音集团业务数量庞大的多模态业务数据和业务需求,团队能够有资源和机会去做出行业领先的技术创新,用最新的技术去改变影响用户和改变行业格局。 1、研究方向:提升视频、音频、图像、文本及多模态的大模型基础能力,在业务领域与通用领域取得行业领先的效果,建设体系化的模型能力提升方法论;探索理解大模型与生成大模型能力结合互补模式,探索并落地一体化模型并取得更高的模型效果;推动多模态内容理解能力在搜索、推荐、广告等场景的落地应用; 2、负责抖音、直播、今日头条等业务场景下的开集内容理解工作,建设多模态大模型、生成式模型等前沿模型技术能力,接近人类感知认知模型能力,产出相应的研究成果; 3、负责抖音等业务场景通用多模态大模型的模型训练和基础建设,包括但不限于模型训练、数据工程、训练推理框架迭代、维护模型评估指标体系; 4、跟进行业最新技术进展,探索多模态方向的新技术研究与落地。
包括英文材料
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
ICML+
https://icml.cc/
CVPR+
https://cvpr.thecvf.com/
ICCV+
https://iccv.thecvf.com/
ICCV is the premier international computer vision event comprising the main conference and several co-located workshops and tutorials.
ECCV+
https://eccv.ecva.net/
ECCV is the official event under the European Computer Vision Association and is biannual on even numbered years.
相关职位
社招2年以上内容理解
1、参与小红书电商、广告的内容理解体系构建,负责直播、笔记、商品的多模态信息结构化算法建设和应用; 2、参与小红书电商、广告的多模态识别和知识图谱体系建设,负责面向业务的商品类目、品牌、属性、SPU体系建设; 4、参与小红书电商、广告的用户理解能力建设,包括用户画像预测、全域用户行为长序列建模,获取社区到大商业的跨域兴趣表达; 5、参与小红书社区、广告、电商等场景搜推优化,以表征、Token形式,帮助搜推各环节(召回、粗排、精排)提升分发效率; 6、参与供应链上下游平台算法建设,基于小红书社区数据挖掘商机、供给源、流程趋势,并落地到B端系统工具; 7、基于多模态大模型针对相关算法和系统的持续迭代,同时能够深入小红书丰富的业务场景,结合实际需求进行技术落地和创新。
更新于 2025-09-12
社招2年以上内容理解
1、参与小红书电商用户增长智能体系建设,负责面向业务的数据挖掘及算法持续迭代; 2、参与小红书电商用户增长基础算法能力迭代,建设基础用户画像、分层、求购行为偏好等; 3、结合海量事实数据及先验特征挖掘,在新用户冷启动阶段,优化优惠券发放、流量分发等;
更新于 2025-09-04
社招2年以上内容理解
1、 触发策略:用户数据理解、深度匹配,传统匹配、用户意图识别、query纠错/改写、相关性建模等; 2、质量预估:点击率、转化率、客单价、交易额预估等; 3、机制设计:排序机制、流量预估、多样性机制等; 4、创意优化:商品图片、标题、优惠信息等展示创意优化;
更新于 2025-09-04