字节跳动抖音多业务场景的大模型训练与应用-小荷健康
任职要求
1、2027届毕业,获得博士学位,人工智能、计算机、数学相关专业优先; 2、优秀的代码能力、数据结构和基础算法功底,熟练掌握C/C++或Python编程语言; 3、熟悉计算机视觉(CV)相关的算法和技术,对MLLM中模型结构、ViT训练、Detail Caption等方向有深入理论研究和实践; 4、有自然语言处…
工作职责
团队介绍:小荷健康团队专注于小荷AI医生业务和抖音/头条医疗搜索业务的相关工程和策略研发,以及小荷健康医疗大模型的研发。我们依托医疗大模型基座的能力,为不同渠道用户提供健康咨询和医疗服务建议能力,助力分级诊疗落地,缓解医患矛盾,缓解优质医疗资源不足且分布不均的问题,并以“为每个中国人/家庭提供一个私人AI医生”为愿景。团队涵盖了前端、客户端、服务端、算法、数据等多个团队。在工程领域我们除了保障业务迭代、性能优化、稳定性工作之外,还会探索先进的跨端技术、适配医疗场景的Agent架构赋能于业务,并积极使用AI Coding提升研发效率。在算法方向,不仅深耕业务全链路策略效果,同时自研的小荷医疗大模型在多个权威医疗Benchmark上达到行业SOTA。 课题介绍: 抖音研发团队,负责抖音短视频、直播、中长视频、搜索、图文、音乐、社交通讯、医疗等业务技术开发,以及字节跳动旗下产品的客服平台、业务安全、用户增长、用户体验、抖音账号、AI技术研究与赋能等中台团队的研发工作。本次课题共涉及5个方向: 1、用户体验:抖音场景下的端侧大模型架构与推理加速体系研究; 2、抖音直播:迭代3D生成大模型,优化数据、编码和模型架构,提升3D资产生成效率和品质; 3、汽水音乐:聚焦音乐生成大模型的核心算法研究与优化,旨在攻克上述技术瓶颈,提升AI音乐创作的质量、可控性与创新性,赋能短视频配乐、虚拟偶像等多元应用场景; 4、AI技术研究与赋能:随着大模型在代码生成与软件开发中的应用不断深化,构建端到端AI Coding模型已成为提升研发效率的关键方向。本课题聚焦从数据构建、模型训练(SFT/RL)、到推理部署的全链路优化,探索从需求理解,代码生成与修复,与功能上线的一体化建模方法。重点解决领域知识注入、大规模SFT训练、Agentic RL等问题,推动AI在抖音等真实业务研发场景中的规模化落地; 5、小荷健康:围绕问诊、工具调用、科普与病例分析,提升医疗大模型任务规划与推理能力,保证结果准确稳定可用。 课题挑战: 1、资源约束极强,需兼顾算力、内存与功耗;通用性要求高,需支撑多业务场景高精度处理;面向差异化设备,实现任务复杂度的弹性适配; 2、高质量3D数据严重稀缺,3D几何与纹理表征复杂,生成质量与美术水准比仍有差距,当前链路冗长效率偏低; 3、音乐审美偏好的量化建模问题、长序列高品质音乐生成问题、多风格泛化与创新生成问题、推理增强方法的迁移应用问题; 4、抖音研发大模型需高效的业务知识注入,复杂且超长的上下文管理,解决高质量训练数据稀缺,Agentic RL的持续训练; 5、小荷健康围绕医疗场景基座模型 ,Agent Foundation构建与评测体系,强化模型复杂知识检索、任务分解及长链路执行能力。通过优化 SFT、RL、OPD等后训练方法的组合策略,兼顾模型效果、稳定性与泛化性。同时探究线上用户体验与基座模型训练间的关联,实现医疗大模型能力与实际应用效果的协同提升。 课题价值: 1、技术价值:等参数量级下,可大规模落地的业界领先模型;业务价值:提升抖音用户和业务接入的覆盖面,获得用户和营收价值; 2、技术上提升3D表征与生成能力,迭代3D生成大模型;业务上支撑直播和社交应用,产出丰富3D资产,满足海量用户的个性化需求; 3、技术上突破音乐生成在审美建模、长序列连贯性等核心瓶颈,引领AI音乐生成技术前沿;业务上提升抖音/汽水音乐的AI创作能力,降低音乐创作门槛,丰富内容生态,提供音乐内容供给; 4、技术上探索前沿模型训练策略,构建字节内部真实环境下的数据飞轮,提高业务研发效率,提升代码质量与性能; 5、技术上提升医疗大模型Agent与Post-Training方向的关键技术突破,提升问诊、科普、病例分析等核心场景业务效果,沉淀可复用的数据、训练与评测方法,支撑长期模型演进。
1、负责小荷AI医生品牌战略规划,塑造鲜明、专业且值得信赖的品牌形象;负责品牌活动策划与执行统筹,对结果负责;了解与把控市场活动执行全链路,包括目标拆解、线下活动、创意物料和事件营销等执行落地; 2、针对小荷AI医生的功能特性与优势,制定产品营销方案,整合内外部资源,有效提升产品市场影响力和用户渗透,同时对品牌声誉进行实时监测,建立高效的舆情应对机制,维护品牌形象; 3、能进行活动效果分析和方法论沉淀,不断优化迭代医疗健康产品营销策略,提升市场活动效果。
项目介绍:抖音产品工程师计划是面向全球具备技术能力的产品经理专属人才计划。在AI发展驱动下,我们寻找懂技术又有产品思维的复合型人才,打破常规“产品”和“技术”的界限,在高挑战的业务实战中亲手用代码实现产品构想。加入抖音,和优秀的人,做有挑战的事,一起定义AI时代的产品未来! 团队介绍:小荷健康是字节跳动旗下的医疗健康品牌,我们致力于利用大模型技术,探索医疗健康服务的新范式,孵化了“小荷AI医生”app,为用户提供专业的健康咨询服务。小荷健康拥有专业的医学和互联网产研团队,认真探索AI医疗。 1、负责抖音产品工作,独立跟进子项目的需求分析与规划,产品需求梳理; 2、与技术团队紧密协作,探索并提出创新的解决方案,推动方案落地。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:小荷健康是字节跳动旗下的医疗健康品牌,我们致力于利用大模型技术,探索医疗健康服务的新范式,孵化了“小荷AI医生”app,为用户提供专业的健康咨询服务。小荷健康拥有专业的医学和互联网产研团队,认真探索AI医疗。 1、参与到AI医生的增长工作,包含增长工具,增长策略; 2、参与跨端导流、推送通知、用户承接、分享裂变等模块中的1个,持续提升该模块对用户规模的贡献度; 3、与算法、评测团队配合,完成增长产品研发,持续迭代策略效果,运用数据和产品策略推动产品价值提升。
1、负责医疗大模型安全能力建设,围绕医疗安全、伦理合规、偏见与公平性等方向,定义医疗大模型的安全能力边界,并持续推动能力落地和效果提升; 2、基于对医疗应用场景和风险的理解,抽象医疗大模型安全能力,并拆解为模型训练和评测所需的能力体系、任务树与评估标准,与算法研发团队协作推进安全策略落地; 3、设计和制定医疗大模型安全相关的评测标准与评测方法,包括但不限于规则评测、Rubric评测、对抗式评测等,构建可量化、可迭代的安全评测体系; 4、负责医疗大模型安全评测数据的采集、构建与维护,探索高质量人工数据与合成数据相结合的数据生产方式,确保数据质量满足安全评测和模型对齐的要求; 5、对模型安全评测结果进行分析和总结,识别模型在安全、伦理和偏见等方面的风险点,与算法团队协作,将评测结论转化为可执行的训练和优化策略,推动模型安全能力持续提升; 6、跟进大模型安全、对齐和评测领域的前沿研究与行业实践,并结合医疗场景特点,持续优化医疗大模型安全能力建设方法论。