字节跳动强化学习算法工程师-电商业务
任职要求
1、熟悉强化学习工作优先,包括但不限于Policy-base methods,Value-based methods,GRPO,PPO等等; 2、熟悉DeepSeek- R1/R1-zero,Qwen-QwQ工作优先; 3、在ACM/ICPC、NOI/IOI、Kaggle 等编程/AI比赛获奖者优先; 4、有ICML、ICLR、NeurIPS、ACL、CVPR等顶级学术会议发表过有影响力研究成果的优先。
工作职责
1、深入研究和应用COT及强化学习技术,建立针对电商大模型推理优化体系,使模型在处理电商复杂问题的准确率显著提升,显著增强模型的动态推理和反思能力,确保模型能够快速、准确地应对电商业务的高复杂度和多变性需求; 2、研发的电商推理优化大模型支持核心电商业务场景(如审核、商品推荐),降低人工审核成本,提升电商业务的智能化水平和运营效率; 3、研究大模型驱动的智能体算法,包括但是不局限于ReACT、Voyager、WebGPT、AutoGPT; 4、撰写技术报告和论文,分享研究成果,参与内外部的技术交流和合作,推动团队技术水平的提升,提高团队在行业内的影响力。
1、深入研究和应用COT及强化学习技术,建立针对电商大模型推理优化体系,使模型在处理电商复杂问题的准确率显著提升,显著增强模型的动态推理和反思能力,确保模型能够快速、准确地应对电商业务的高复杂度和多变性需求; 2、研发的电商推理优化大模型支持核心电商业务场景(如审核、商品推荐),降低人工审核成本,提升电商业务的智能化水平和运营效率; 3、研究大模型驱动的智能体算法,包括但是不局限于ReACT、Voyager、WebGPT、AutoGPT; 4、撰写技术报告和论文,分享研究成果,参与内外部的技术交流和合作,推动团队技术水平的提升,提高团队在行业内的影响力。
团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 课题背景:抖音为用户提供了从娱乐、教育到生活方式的众多内容,形成了广泛的兴趣图谱。多样化的内容消费,不仅反映了用户的即时偏好,还蕴含了深层的消费喜好和潜在购物需求。如何有效建模用户对娱乐内容的兴趣并迁移至电商场景,成为了一个亟待解决的课题。不仅涉及到理解对视频内容的理解,还需构建跨域的兴趣映射机制,实现从内容兴趣到电商兴趣的高效建模。与此同时,随着大模型多模态技术的兴起,我们希望在语言、视频、推荐多个模态下,构建更加强大的推荐系统。 课题挑战: 1)多模态复杂性:用户行为涉及多模态交互(如视频+直播+文字+行为),需统一框架实现内容理解与用户意图推理; 2)识别非电商内容对应的潜在购物信号,研究从内容消费到电商兴趣的高效映射; 3)利用海量数据和世界知识搭建领先的机器学习和推荐服务,实现用户和商品的高效匹配; 研究方向:大语言模型、多模态大模型、内容理解、推荐系统。
团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 课题背景:抖音为用户提供了从娱乐、教育到生活方式的众多内容,形成了广泛的兴趣图谱。多样化的内容消费,不仅反映了用户的即时偏好,还蕴含了深层的消费喜好和潜在购物需求。如何有效建模用户对娱乐内容的兴趣并迁移至电商场景,成为了一个亟待解决的课题。不仅涉及到理解对视频内容的理解,还需构建跨域的兴趣映射机制,实现从内容兴趣到电商兴趣的高效建模。与此同时,随着大模型多模态技术的兴起,我们希望在语言、视频、推荐多个模态下,构建更加强大的推荐系统。 课题挑战: 1)多模态复杂性:用户行为涉及多模态交互(如视频+直播+文字+行为),需统一框架实现内容理解与用户意图推理; 2)识别非电商内容对应的潜在购物信号,研究从内容消费到电商兴趣的高效映射; 3)利用海量数据和世界知识搭建领先的机器学习和推荐服务,实现用户和商品的高效匹配; 研究方向:大语言模型、多模态大模型、内容理解、推荐系统。