腾讯大模型平台算法工程师(深圳/北京/上海)
任职要求
1.领域经验:需具备大模型相关领域的经验,特别是在算法设计和工程实现方面有深入研究和实践经历; 2.技术能力:具备扎实的机器学习理论基础,熟悉深度学习框架(如PyTorch),有分布式训练经验(如DeepSpeed、Megatron等)者优先; 3.创新与学习:对大模型技术充满热情,具备持续学习和实践前沿方法的能力,能够在实际项目中创新和改进现有技术; 4.教育背景:计算机科学、机器学习、深度学习、统计学、应用数学等相关专业的硕士及以上学历; 5.学术与实践:有在高水平国际会议或学术期刊发表相关论文,或有高水平竞赛获奖经历者优先。
工作职责
1.负责大模型全模态从训练到推理部署的全流程工作,在机器学习平台上引入并优化前沿算法和技术,以推动工程与模型性能的提升和业务的落地。专注于以下一个或多个方向:; 2.训练数据构建与优化:开发自动化工具和智能算法,以优化多源数据的获取、清洗、配比和合成,提升训练数据的质量和效率; 3.模型训练与优化:设计和实现训练流程自动化工具,包括超参数优化、训练早停策略、模型选择等,以提高训练效率和模型性能; 4.强化学习与后训练优化:研究和应用强化学习算法,包括异步方法、长思考推理模型训练等,以提升模型的样本效率和稳定性; 5.Agentic RL应用:利用Tool-integrated Reasoning等技术解决复杂业务问题,搭建适用于不同场景的Agentic RL框架。
团队介绍:广告业务原为商业产品与技术部门,为抖音集团的商业变现提供广告产品与技术,负责端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,践行"激发生意新可能"理念,致力于让营销更省心、更高效、更美好,推动商业的可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里,你将投身建设面向未来的数字营销能力,接触到全球先进的商业产品架构、模型和算法,在互联网广告行业始终创新。 课题介绍: 1、核心技术架构: 1)下一代广告技术栈: 模型算法层:搭建基于强化学习的智能出价与流量预估系统,攻克深层转化场景下的数据稀疏、多源异构数据融合(延迟数据/埋点噪声/跨平台行为)等行业难题; 系统工程层:构建支持基于长序列特征的实时预估框架,研发支持动态创意组合的自动化投放引擎; AIGC融合层:建立文/图/视频多模态生成技术中台,实现从IP素材生成到智能投放的全链路闭环; 2)行业首创的AIGC解决方案: 正在搭建全球领先的"小说→漫剧"智能生产线,攻克三大技术堡垒: 多模态叙事引擎:研发支持角色一致性保持(Character-aware Diffusion)、分镜自动生成(Storyboard LLM)、动态运镜控制(Camera ControlNet)的复合型生成框架; 工业化工作流:构建支持分布式渲染、多版本AB测试、合规性审核的智能生产管线,实现日均千级素材产能; 投放增效系统:开发生成质量量化评估模型(QAGAN),建立素材生成-投放效果的反哺优化机制; 2、岗位挑战: 你将主导: 构建支持沿模型的混合推理框架,优化多卡并行下的生成效率; 设计跨模态对齐算法,提升文字指令到视觉元素的可控生成精度; 研发基于用户行为分析的智能素材变异系统,实现CTR提升30%+的个性化内容生成; 打造从内容生产到实时竞价的全自动化广告引擎; 3、我们期待这样的开拓者: 精通Diffusion Models技术栈,具有LoRA/ControlNet/T2I-Adapter等微调框架的实战调优经验; 熟悉多模态大模型(如VideoPoet、Sora等视频生成技术原理),具备跨模态表征学习研究背景; 拥有广告算法背景者优先,熟悉CVR预估、智能出价等核心模块与生成式AI的结合点; 出色的工程化能力,主导过至少一个完整AIGC项目的端到端落地(从模型训练到服务部署)。
团队介绍:广告业务原为商业产品与技术部门,为抖音集团的商业变现提供广告产品与技术,负责端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,践行"激发生意新可能"理念,致力于让营销更省心、更高效、更美好,推动商业的可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里,你将投身建设面向未来的数字营销能力,接触到全球先进的商业产品架构、模型和算法,在互联网广告行业始终创新。 课题介绍: 1、核心技术架构: 1)下一代广告技术栈: 模型算法层:搭建基于强化学习的智能出价与流量预估系统,攻克深层转化场景下的数据稀疏、多源异构数据融合(延迟数据/埋点噪声/跨平台行为)等行业难题; 系统工程层:构建支持基于长序列特征的实时预估框架,研发支持动态创意组合的自动化投放引擎; AIGC融合层:建立文/图/视频多模态生成技术中台,实现从IP素材生成到智能投放的全链路闭环; 2)行业首创的AIGC解决方案: 正在搭建全球领先的"小说→漫剧"智能生产线,攻克三大技术堡垒: 多模态叙事引擎:研发支持角色一致性保持(Character-aware Diffusion)、分镜自动生成(Storyboard LLM)、动态运镜控制(Camera ControlNet)的复合型生成框架; 工业化工作流:构建支持分布式渲染、多版本AB测试、合规性审核的智能生产管线,实现日均千级素材产能; 投放增效系统:开发生成质量量化评估模型(QAGAN),建立素材生成-投放效果的反哺优化机制; 2、岗位挑战: 你将主导: 构建支持沿模型的混合推理框架,优化多卡并行下的生成效率; 设计跨模态对齐算法,提升文字指令到视觉元素的可控生成精度; 研发基于用户行为分析的智能素材变异系统,实现CTR提升30%+的个性化内容生成; 打造从内容生产到实时竞价的全自动化广告引擎; 3、我们期待这样的开拓者: 精通Diffusion Models技术栈,具有LoRA/ControlNet/T2I-Adapter等微调框架的实战调优经验; 熟悉多模态大模型(如VideoPoet、Sora等视频生成技术原理),具备跨模态表征学习研究背景; 拥有广告算法背景者优先,熟悉CVR预估、智能出价等核心模块与生成式AI的结合点; 出色的工程化能力,主导过至少一个完整AIGC项目的端到端落地(从模型训练到服务部署)。
团队介绍:抖音内容理解团队负责抖音集团内容算法工作,业务覆盖抖音、今日头条、西瓜视频、剪映等业务,承接业务在内容理解、LLM应用、新业务方向探索等方向的工作。技术上涵盖了CV,NLP,音频,LLM等算法方向。团队承载业务需求同时还负责底层基础算法技术,推动如基础预训练模型、视频生成等学术和专利相关工作,负责为抖音各个技术方向提供长期有深度的技术支撑。得益于抖音集团业务数量庞大的多模态业务数据和业务需求,团队能够有资源和机会去做出行业领先的技术创新,用最新的技术去改变影响用户和改变行业格局。 1、课题背景:随着多模态大模型效果的提升,现已变成了多个业务和技术方向的核心算法能力。随着业务在内容理解、推荐系统、内容治理、客服、创新业务等方向的广泛应用,对于多模态大模型也带来了新的算法能力需求:(1)内容理解:团队涉及了包括视频、直播、评论、图文等等不同的内容体裁和业务形态,集团公司所覆盖的活跃用户每天会产生数量巨大品类丰富的多模态内容,在提供了独一无二内容数据的同时,也衍生出来了独特的业务和技术需求;(2)多模态对话能力:作为大模型技术最直接的应用场景对话场景,团队在客服、AI分身等领域快速推进相关技术的落地应用。对应方向的多模态内容理解和挖掘、多模态对话能力是支撑该场景的重要基础技术,需要建设作者profile抽取、业务多模态文档挖掘、多模态对话模型等技术建设;(3)业务和技术创新:MLLM技术对于包括推荐、内容理解、社交等业务方向和算法技术都造成了巨大的冲击,多模态模型技术作为核心技术正在重构每一个重要的方向,会在下一代推荐系统、新业务形态、内部流程架构重构上扮演关键角色。 2、课题挑战:(1)高标准的算法要求:推荐系统、内容治理等方向内容理解的复杂度远高于公开评测集,团队需要在海量内容的业务真实场景下探索高效率、高标准的多模态算法解法,帮助团队迭代新一代的推荐系统、内容理解系统;(2)复杂的多模态生态交互:内容作者、内容消费者、社交交互、评论交互等不同角色在平台形成复杂的多模态交互,由此衍生出新的内容交互语义、生态互动逻辑,对多模态大模型算法提出了独特的算法挑战;(3)业务创新:大模型在多个领域都展现出来了卓越的理解和交互能力,如何应用新技术创造出新的业务方向,如何公司内部用新技术替代掉老的系统和流程,要求算法团队在有足够扎实技术能力的同时对业务和技术有足够深入的思考。 3、研究方向:大语言模型、多模态大模型、内容理解、推荐系统。
团队介绍:抖音内容理解团队负责抖音集团内容算法工作,业务覆盖抖音、今日头条、西瓜视频、剪映等业务,承接业务在内容理解、LLM应用、新业务方向探索等方向的工作。技术上涵盖了CV,NLP,音频,LLM等算法方向。团队承载业务需求同时还负责底层基础算法技术,推动如基础预训练模型、视频生成等学术和专利相关工作,负责为抖音各个技术方向提供长期有深度的技术支撑。得益于抖音集团业务数量庞大的多模态业务数据和业务需求,团队能够有资源和机会去做出行业领先的技术创新,用最新的技术去改变影响用户和改变行业格局。 1、课题背景:随着多模态大模型效果的提升,现已变成了多个业务和技术方向的核心算法能力。随着业务在内容理解、推荐系统、内容治理、客服、创新业务等方向的广泛应用,对于多模态大模型也带来了新的算法能力需求:(1)内容理解:团队涉及了包括视频、直播、评论、图文等等不同的内容体裁和业务形态,集团公司所覆盖的活跃用户每天会产生数量巨大品类丰富的多模态内容,在提供了独一无二内容数据的同时,也衍生出来了独特的业务和技术需求;(2)多模态对话能力:作为大模型技术最直接的应用场景对话场景,团队在客服、AI分身等领域快速推进相关技术的落地应用。对应方向的多模态内容理解和挖掘、多模态对话能力是支撑该场景的重要基础技术,需要建设作者profile抽取、业务多模态文档挖掘、多模态对话模型等技术建设;(3)业务和技术创新:MLLM技术对于包括推荐、内容理解、社交等业务方向和算法技术都造成了巨大的冲击,多模态模型技术作为核心技术正在重构每一个重要的方向,会在下一代推荐系统、新业务形态、内部流程架构重构上扮演关键角色。 2、课题挑战:(1)高标准的算法要求:推荐系统、内容治理等方向内容理解的复杂度远高于公开评测集,团队需要在海量内容的业务真实场景下探索高效率、高标准的多模态算法解法,帮助团队迭代新一代的推荐系统、内容理解系统;(2)复杂的多模态生态交互:内容作者、内容消费者、社交交互、评论交互等不同角色在平台形成复杂的多模态交互,由此衍生出新的内容交互语义、生态互动逻辑,对多模态大模型算法提出了独特的算法挑战;(3)业务创新:大模型在多个领域都展现出来了卓越的理解和交互能力,如何应用新技术创造出新的业务方向,如何公司内部用新技术替代掉老的系统和流程,要求算法团队在有足够扎实技术能力的同时对业务和技术有足够深入的思考。 3、研究方向:大语言模型、多模态大模型、内容理解、推荐系统。