字节跳动NLP算法工程师-广告智能客服
任职要求
1、硕士研究生及以上学历,扎实的NLP算法基础,2年以上NLP相关经验,对LLM大模型、问答系统、语义理解、文本分类、相似匹配等有较深入理解和实践; 2、熟练使用TensorFlow/PyTorch等开源深度学习框架,对深度学习训练、模型调优和推理加速等有…
工作职责
1、深入理解垂直领域业务规则,承担智能客服、问答系统的算法研究及开发,以高效的进行用户接待及信息收集; 2、跟进业界前沿算法,探索NLP/LLM大模型等技术,并结合业务场景取得应用落地; 3、负责优化LLM生成式大模型的在场景下的微调,使其以更自然、精准、友好、可控的方式与用户沟通; 4、探索LLM与文档、数据库等外源数据的结合,探索以目标为导向的模型范式。
团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、团队负责公司大模型的研发和应用,研究相关技术在搜索、推荐、广告、创作、对话和客服等领域的全新应用和解决方案,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式;主要工作方向包括: 1)优化&创新RLHF算法训练效率与模型泛化能力; 2)Long CoT技术的实现和应用; 3)多模态大模型(文本、图像、语音)的Posttraining算法; 4)构建高质量、多领域的数据合成方法; 5)探索LLM在情感对话、创作等场景的应用。
1. 负责商业增值业务场景中大模型的技术落地,支持业务目标提升; 2. 负责大模型在智能助手、电销、IM等交互式对话场景中的应用,提升场景的自动化与智能化水平,改进商家的交互体验,提升广告供给; 3. 负责大模型在经营诊断分析、多模态创意生成等内容生成类场景中的应用,降低平台和商家的运营成本,提升运营效率; 4. 负责大型语言模型的微调、偏好对齐、知识增强等技术探索,积极跟进AIGC业内应用趋势,包括并不限于多模态、RLHF、Agent等方向; 5. 与其他团队密切合作,包括数据工程师、前后端工程师、产品经理等,实现高质量的产品和解决方案。
1、深入理解垂直领域业务规则,承担智能客服、问答系统的算法研究及开发,以高效的进行用户接待及信息收集; 2、跟进业界前沿算法,探索NLP/LLM大模型等技术,并结合业务场景取得应用落地; 3、负责优化LLM生成式大模型的在场景下的微调,使其以更自然、精准、友好、可控的方式与用户沟通; 4、探索LLM与文档、数据库等外源数据的结合,探索以目标为导向的模型范式。
团队介绍:1、业务方向:自助业务希望建成中小商家的业务中台,电商广告、生服广告、Dou+等多条业务线,一站式解决商家问题,助力商家成长,提升商家数字化经营能力; 2、技术亮点:自助技术分为智能销售、客户增长、营销活动几个方向; 客户增长方向主要利用Uplift建模、因果推断、运筹优化算法、推荐算法等,通过对客户初期的行为习惯进行挖掘,探索更优的发券、选品、选素材等相关策略,提升拉新指标; 智能销售方向主要通过LLM-Agent的形式,利用sft、rl等算法优化广告领域的服务能力,提升对中小客户的教育、辅导、服务等能力,进而提升长期客户消耗; 营销活动方向主要服务商业化运营团队,辅助运营完成营销活动的创建与推广。 课题背景: 为了长期优化广告客户生态以及收入增长,商业化需要更大规模的做好客户拉新和客户在投放成长初期的留存,那么如何精准定位目标人群、如何更有效的利用激励手段促进客户增长、如何优化当前客户动作和投放手段,就是一个必须要长期优化的方向。 现在的增长方向主要靠传统机器学习的手段来决策激励的发放,但效果提升已经遇到瓶颈,需要探索基于RL的因果推断技术。另一方面,客户成长初期目前无法获得足够的服务与帮助,结合上广告投放本身有较高学习门槛,所以现在亟需依赖LLM技术,实现智能销售的愿景——包括智能客服、智能销售、智能投手三个阶段,最终达到全智能化的托管式服务。 课题挑战: 相比抖音C端流量数据,广告客户数据相对波动较大,观测周期长,有更多的不确定性; 大语言模型在广告领域的能力依然不足,具体表现在领域知识理解不足,大量专业工具(百量级)的使用效率不高,业务回复的可解释性不够强。为了达到人工销售的水平,需要探索RL、探索reward system、探索deep research的实现、探索业务向Benchmark的范式等等; 相比传统客服的问答式工作,还需要探索LLM在主动服务方向的开放命题。