logo of bytedance

字节跳动NLP算法实习生-财经业务-筋斗云人才计划

实习兼职A146885地点:北京状态:招聘

任职要求


1、2026届及之后毕业,博士在读,人工智能、大模型NLP相关专业优先;
2、优秀的代码能力,掌握常见编程语言和算法,熟悉Pytorch或TF等机器学习编程框架; 
3、在大模型RAG、智能对话或搜索等方向要求有丰富的实践经验,在ACL/EMNLP/SIGIR/WWW等顶级期刊会议上发表论文者优先; 
4、有大模型训练和微调经验的同学优先;
5、出色的问题分析和解决能力,有自主探索解决方案的能力;良好的沟通协作能力,能和团队一起探索新技术,推进技术进步;
6、出色的心理素质与应变能力,面对困难勇于迎接挑战;面对复杂局面沉着、冷静、灵活。

工作职责


团队介绍:依托抖音集团的科技能力和产品,我们为抖音电商、生活服务、直播等场景提供金融服务,为抖音用户提供更好的支付、消费金融、保险等金融服务。科技创新,普惠大众。
大模型&NLP算法团队,支持财经各业务场景的大模型/NLP算法,负责包括智能客服、智能助理、智能外呼、客户体验体系建设等财经NLP及对话应用场景的建设。通过财经领域知识结合生成式大模型、检索增强生成(RAG)、文本理解等技术。建设财经领域内行业领先的智能对话能力和自然语言理解能力,提升财经用户体验和保险/消金等场景智能售前/售后的转化率和满意度。

课题背景:
尽管现有的预训练语言模型在通用领域的生成任务中表现出色,但由于训练数据专业性不足和训练任务缺乏针对性,其在财经领域的应用仍存在明显短板。这主要体现在难以准确理解财经领域特有的业务知识,以及生成内容无法符合该领域特定的业务规则等方面。例如,在财经对话场景中,模型由于缺乏业务背景知识,可能会误解用户意图,生成违反业务规则或偏离市场实际情况的回答,甚至生成与财经业务不符的内容,从而导致生成结果的可信度不足。因此,如何通过领域自适应学习、领域动态知识注入以及领域可解释性生成等技术,提升模型对财经领域的理解和生成能力,已成为一个亟待解决的关键难题。
课题挑战:
目前的预训练语言模型主要基于通用领域的大规模文本数据进行训练,但在面对垂直领域的挑战时,尤其是依赖精确市场分析和特有业务背景知识的财经领域场景,仍然面临诸多困难。这些模型在理解复杂领域文本、整合专业知识、完成特定任务推理以及生成可靠的领域文本方面,存在明显局限性。
首先,当前的大规模预训练语言模型在财经领域的业务知识理解和整合方面仍存在明显不足。即便是像 GPT-4 等当前最先进的模型,也未能深入学习和掌握财经领域的业务背景、知识体系以及行业规范,导致其在财经对话场景中难以精准把握用户意图,无法准确理解复杂的业务逻辑和上下文关联关系。此外,这些模型缺少领域专家知识的监督机制,生成的文本容易出现业务逻辑错误和事实偏差,甚至违反财经领域特定的业务规则。因此,如何构造针对财经领域的自适应训练任务,增强模型在财经领域的知识理解能力,已成为亟待解决的关键问题。
其次,财经领域高度依赖动态更新的市场信息,而当前的大规模预训练语言模型难以快速适配动态更新的领域知识。由于预训练阶段知识的滞后性,这些模型无法在对话中提供对用户有价值的实时分析与建议。因此,如何改进领域知识注入和动态知识学习的训练方法,提升模型在财经对话场景下快速适应新知识的能力,是大模型快速迁移垂直领域的急迫需求。
最后,现有生成式人工智能在财经对话场景中的透明性和可解释性方面仍显不足,用户难以清晰了解模型生成过程及其依据,导致生成结果特别是在涉及市场预测或投资策略等高风险场景时的可信度受到质疑。因此,如何提升文本生成的透明性和可解释性,提升文本生成可信性,是大模型正式投身生产应用的关键卡点。
包括英文材料
大模型+
NLP+
算法+
PyTorch+
机器学习+
RAG+
相关职位

logo of bytedance
实习A11736A

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:依托抖音集团的科技能力和产品,我们为抖音电商、生活服务、直播等场景提供金融服务,为抖音用户提供更好的支付、消费金融、保险等金融服务。科技创新,普惠大众。 1、参与生成式智能对话场景算法研发,提升产品转化率和用户体验; 2、建设基于RAG框架的智能问答系统,优化文本理解、召回、相关性、问答生成等算法; 3、对长文本/海量文本进行深度分析、抽取事件、情感分析,构建知识图谱; 4、搭建和优化搜索排序、在线生成系统,提供稳定的线上服务。

更新于 2025-02-14
logo of netease
实习网易游戏(互娱)

- 参与NLP算法落地工作,包括但不限于数据清洗、数据建模、模型训练、流程设计、效果评估等; - 进行模型训练和应用设计,并根据反馈持续迭代,提升效果。

更新于 2025-05-08
logo of xiaohongshu
实习内容理解

1、海量文本数据处理,包含分类、质量打分、语义识别等; 2、建立文本处理流程,持续优化模型效果; 3、跟踪最新NLP研究成果,并应用到处理流程中。

更新于 2025-07-25
logo of kuaishou
实习D13918

1、负责知识体系、对话系统、机器翻译的研发、实现和优化,用户搜索意图理解,实体NER,搜索语言模型,纠错改写,搜索需求图谱,搜索交互引导,智能对话等方向; 2、负责文本分类、语义理解、情感分析等NLP任务的研发工作; 3、负责智能客服、文本安全、短视频搜索等多个业务领域的内容挖掘、用户标签构建、知识图谱构建等; 4、负责NLP算法系统的开发和优化。

更新于 2025-07-16