字节跳动西瓜个性化推荐研判-CQC(成都)
任职要求
1、本科及以上学历,新闻、中文专业优先,有门户、资讯应用内容推送、值班编辑经验者优先;
2、文字功底扎实,有语感,具备较强的撰写和质量把控能力,灵活多变,…工作职责
1、基于平台安全、生态标准,针对视频作者发布的生活、美食、旅游、游戏、三农等垂类视频内容进行内容质量把控和文案改写,提升推送质量; 2、通过积累和总结日常质量把控案例,发现潜在风险和标准未覆盖场景,推动标准的优化和迭代; 3、维护视频平台推送的质量与画风,提升用户使用体验。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、为全球企业级客户提供高效的算法服务,包括但不限于传统搜推广、大模型技术与搜推结合以及大模型应用产品; 2、理解不同行业的客户场景和需求,落地相应的算法解决方案,包括但不限于电商/内容推荐、基于大模型技术的搜索方案以及知识库问答等LLM上层应用; 3、探索大模型相关方向的前沿技术,推进相关技术在业务场景的落地,包括但不限于长序列建模/多模态/RAG/智能体; 4、与产品研发团队协作建设平台产品,在多云环境下为全球范围内的客户提供算法解决方案,包括但不限于智能推荐平台和大模型搜推平台。
团队介绍:广告业务原为商业产品与技术部门,为抖音集团的商业变现提供广告产品与技术,负责端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,践行"激发生意新可能"理念,致力于让营销更省心、更高效、更美好,推动商业的可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里,你将投身建设面向未来的数字营销能力,接触到全球先进的商业产品架构、模型和算法,在互联网广告行业始终创新。 课题背景: 随着人工智能技术的快速发展,大模型技术在交易与广告场景中的应用日益广泛,已成为推动行业创新和效率提升的重要驱动力。大模型凭借其强大的学习能力和泛化性能,在多个领域展现出显著优势。例如,推荐大模型能够精准捕捉用户偏好,提升个性化推荐效果;AIGC(AI-Generated Content)技术可用于广告创意、商品图片和视频生成,大幅降低创作成本并提升内容质量;广告投放诊断系统和诊断助手帮助优化投放策略;智能客服、影片智能剪辑、智能导购、大模型审核、用户序列建模以及多模态广告和用户理解等应用,则通过自然语言处理、多模态数据融合等技术,提升用户体验和业务效率。 然而,交易与广告场景对大模型系统的要求极高,不仅需要模型具备出色的精度和泛化能力,还需在实时性、稳定性、可扩展性等方面满足严苛标准。特别是在大规模分布式训练、推理加速、异构硬件支持、多模态数据处理以及系统集成等方面,存在诸多技术难点。因此,针对交易与广告场景研发和优化大模型系统,不仅是人工智能技术发展的前沿方向,也是行业应用的迫切需求。本课题旨在通过系统和工程领域的深入研究,突破关键技术瓶颈,构建高效、稳定、可扩展的大模型解决方案,为交易与广告场景提供强有力的技术支撑。 课题挑战: 1、大规模分布式训练加速:大模型训练需处理海量数据和高复杂度计算,导致训练耗时长、资源需求大。如何优化分布式训练架构,提升数据并行、模型并行和流水线并行的效率,是首要技术难题。 2、推理加速和性能优化:交易与广告场景对实时性要求极高,如广告投放需毫秒级决策。如何在资源受限环境下通过模型压缩和推理引擎优化实现快速推理,是关键挑战。 3、异构硬件支持:大模型需适配多种硬件平台。如何实现高效部署和负载均衡,确保跨硬件精度一致性和高性能,是技术难点。 4、编译优化:编译优化是过程复杂,如何开发高效编译器,优化长尾/灵活模型或结构在不同Accelerator执行效率并减少延迟,是亟待解决的问题。 5、Agent工程:智能客服和导购等应用需构建自主决策的AI Agent。如何设计高效的Agent系统,支持复杂任务执行,是前沿挑战。 6、强化学习框架:强化学习在广告投放优化等场景中潜力巨大。如何构建高效框架,支持大规模环境训练和推理,是研究难点。 课题内容: 1、大规模分布式训练加速技术 1)研究数据并行、模型并行和混合并行算法,优化训练效率; 2)开发自适应负载均衡机制,减少资源浪费; 3)探索梯度压缩和通信优化技术,降低网络开销; 2、推理加速与性能优化方法 1)研究模型压缩技术(如量化、剪枝),减小模型体积; 2)开发高效推理引擎,支持批量推理和异步处理; 3)针对不同Accelerator的架构加速推理过程; 3、异构硬件支持与优化 1)设计通用部署框架,支持多硬件无缝集成; 2)开发硬件感知调度算法,优化任务分配; 3)研究跨硬件模型迁移技术,确保精度一致; 4、编译优化技术 1)深入优化模型编译器,优化长尾场景的计算开销; 2)研究图优化和算子融合技术,减少计算开销; 3)探索动态优化方法,提升运行时效率; 5、Agent工程与实现 1)设计模块化Agent架构,支持任务分解和决策; 2)开发多模态交互技术,提升用户体验; 3)研究Agent训练与评估方法,优化复杂场景性能; 6、强化学习框架构建 1)开发高效强化学习算法,支持多智能体协作; 2)针对交易与广告场景的训练场景优化训练速度,提升迭代效率; 3)探索强化学习在广告投放中的应用,提升决策效果。
团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 课题介绍: 1、课题背景:随着互联网数据规模的爆炸式增长和用户对搜索体验需求的不断提升,传统搜索引擎基于关键词匹配和规则推理的局限性日益凸显。例如,用户意图的复杂性、自然语言的歧义性、多模态数据(文本、图像、视频等)的融合检索需求,以及长尾查询的精准响应等问题,均对搜索系统的智能化提出了更高要求。 近年来,大模型技术(如GPT、BERT、多模态大模型等)在自然语言理解、知识推理和生成任务中展现出强大能力,为智能搜索的语义理解、意图识别和个性化推荐提供了新的技术路径。同时,数据库技术在高效数据存储、索引优化和实时检索方面的持续演进,为构建支持大模型推理的高性能搜索系统奠定了基础。 2、研究方向:本课题旨在结合大模型技术与数据库技术,探索新一代智能搜索系统的核心架构与关键技术,突破传统搜索的语义理解瓶颈,构建更高效、精准且可扩展的智能搜索服务,满足复杂场景下的用户需求。
团队介绍:字节跳动搜索团队主要负责抖音、国际化短视频、今日头条、西瓜视频等产品以及电商、生活服务等业务的搜索算法创新和架构研发工作。我们使用前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。 主要工作方向包括: 1、探索前沿的NLP技术:从基础的分词、NER,文本、多模态预训练,到业务上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战; 2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,实现多模态视频搜索强大的语义理解和检索能力; 3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你; 4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新; 5、推荐技术:基于超大规模机器学习技术,构建业界领先的搜索推荐系统,对搜索推荐技术进行探索和创新。 课题介绍: 1、课题背景:随着互联网数据规模的爆炸式增长和用户对搜索体验需求的不断提升,传统搜索引擎基于关键词匹配和规则推理的局限性日益凸显。例如,用户意图的复杂性、自然语言的歧义性、多模态数据(文本、图像、视频等)的融合检索需求,以及长尾查询的精准响应等问题,均对搜索系统的智能化提出了更高要求。 近年来,大模型技术(如GPT、BERT、多模态大模型等)在自然语言理解、知识推理和生成任务中展现出强大能力,为智能搜索的语义理解、意图识别和个性化推荐提供了新的技术路径。同时,数据库技术在高效数据存储、索引优化和实时检索方面的持续演进,为构建支持大模型推理的高性能搜索系统奠定了基础。 2、研究方向:本课题旨在结合大模型技术与数据库技术,探索新一代智能搜索系统的核心架构与关键技术,突破传统搜索的语义理解瓶颈,构建更高效、精准且可扩展的智能搜索服务,满足复杂场景下的用户需求。