
同花顺大模型/NLP算法工程师
任职要求
1、计算机区相关专业硕士及以上学历,博士优先; 2、熟练掌握大模型continue pretrain, SFT, RLHF等优化模型方法,能够独立开展相关研发工作,有大模型agent应用落地经验者优先; 3、持续跟踪 NLP 领域的最新进展,并结合自身业务能提出见解,拓展业务边界; 4、扎实的代码功底和工程开发能力,精通Linux 平合下的C++/Python 语言开发,熟练掌握 transformers, llama-factory等训练框架;对langchain, autogen, metaGPT等主流agent框架有深入理解; 5、目标感强,善于分析和发现问题,拆解简化,有较好的沟通和推动能力; 6、优先考虑在 ACL、 EMNLP、NAACL、 NeurlPS、 ICLR、ICML 等会议发表论文的候选人。
工作职责
团队介绍:智能投研是是指将人工智能、大数据、机器学习等先进技术应用于投资研究领域,以提高投资决策效率和准确性的一种创新方法。 人工智能时代已经到来!同花顺不断运用公司储备的各种AI技术对金融终端赋能。我们运用文本、图像、语音语义的识别技术,极大地提升了底层金融信息的获取速度;运用机器学习与知识图谱技术,对百万篇研究报告、新闻资讯进行金融投资逻辑的抽取与推理,形成了若干投资图谱;运用语音与意图识别技术,支持自然语言、语音对话,改变了传统交互模式;运用云计算等技术,支持投资策略的回测与自动化交易。 1、负责大模型在金融投研场景下的应用落地,重点打造投研chatbot agent,以及研报写作agent,持续优化大模型的长上下文能力、agent规划能力及工具使用能力; 2、与产品、业务专家共同制定大模型在不同业务中的评价系统及数据标注规范,打通RLHF的数据生产链路,持续优化模型性能; 3、对界前沿技术保持敏感,结合业务特点,探索前沿的算法技术并应用于实际业务,实现算法技术突破与创新。
1. 推动NLP和大模型算法在社区业务中的落地,负责基础NLP相关算法研发。并参与; 2. 参与智能客服算法开发,探索agent框架在客服业务中的应用; 3. 参与翻译算法和海外多语言策略开发,探索大模型在多语言环境中的应用; 4. 参与小红书生成式搜索相关算法和系统研发,通过最新的生成式AI等技术,打造新一代智能化搜索引擎; 5. 探索大模型预训练、文本理解、多模态理解、多模态推理等多个前沿方向在业务中的前瞻应用。
团队介绍:依托抖音集团的科技能力和产品,我们为抖音电商、生活服务、直播等场景提供金融服务,为抖音用户提供更好的支付、消费金融、保险等金融服务。科技创新,普惠大众。 大模型&NLP算法团队,支持财经各业务场景的大模型/NLP算法,负责包括智能客服、智能助理、智能外呼、客户体验体系建设等财经NLP及对话应用场景的建设。通过财经领域知识结合生成式大模型、检索增强生成(RAG)、文本理解等技术。建设财经领域内行业领先的智能对话能力和自然语言理解能力,提升财经用户体验和保险/消金等场景智能售前/售后的转化率和满意度。 课题背景: 尽管现有的预训练语言模型在通用领域的生成任务中表现出色,但由于训练数据专业性不足和训练任务缺乏针对性,其在财经领域的应用仍存在明显短板。这主要体现在难以准确理解财经领域特有的业务知识,以及生成内容无法符合该领域特定的业务规则等方面。例如,在财经对话场景中,模型由于缺乏业务背景知识,可能会误解用户意图,生成违反业务规则或偏离市场实际情况的回答,甚至生成与财经业务不符的内容,从而导致生成结果的可信度不足。因此,如何通过领域自适应学习、领域动态知识注入以及领域可解释性生成等技术,提升模型对财经领域的理解和生成能力,已成为一个亟待解决的关键难题。 课题挑战: 目前的预训练语言模型主要基于通用领域的大规模文本数据进行训练,但在面对垂直领域的挑战时,尤其是依赖精确市场分析和特有业务背景知识的财经领域场景,仍然面临诸多困难。这些模型在理解复杂领域文本、整合专业知识、完成特定任务推理以及生成可靠的领域文本方面,存在明显局限性。 首先,当前的大规模预训练语言模型在财经领域的业务知识理解和整合方面仍存在明显不足。即便是像 GPT-4 等当前最先进的模型,也未能深入学习和掌握财经领域的业务背景、知识体系以及行业规范,导致其在财经对话场景中难以精准把握用户意图,无法准确理解复杂的业务逻辑和上下文关联关系。此外,这些模型缺少领域专家知识的监督机制,生成的文本容易出现业务逻辑错误和事实偏差,甚至违反财经领域特定的业务规则。因此,如何构造针对财经领域的自适应训练任务,增强模型在财经领域的知识理解能力,已成为亟待解决的关键问题。 其次,财经领域高度依赖动态更新的市场信息,而当前的大规模预训练语言模型难以快速适配动态更新的领域知识。由于预训练阶段知识的滞后性,这些模型无法在对话中提供对用户有价值的实时分析与建议。因此,如何改进领域知识注入和动态知识学习的训练方法,提升模型在财经对话场景下快速适应新知识的能力,是大模型快速迁移垂直领域的急迫需求。 最后,现有生成式人工智能在财经对话场景中的透明性和可解释性方面仍显不足,用户难以清晰了解模型生成过程及其依据,导致生成结果特别是在涉及市场预测或投资策略等高风险场景时的可信度受到质疑。因此,如何提升文本生成的透明性和可解释性,提升文本生成可信性,是大模型正式投身生产应用的关键卡点。
1、负责内容安全相关的自然语言处理核心算法的研究与开发,如文本分类、情感分析、长文本语义理解、舆情分析等,构建并优化NLP模型,提升模型性能与快速对抗变异风险能力,对于涉z、色情、违规等内容进行全方位的识别,构建业界领先的内容识别能力; 2、跟踪NLP领域前沿技术与研究成果,探索新技术在实际业务中的应用,如大模型微调、加速等,针对不同业务形态,提出创新性的NLP解决方案; 3、与业务部门紧密合作,了解业务需求,推动内容安全解决方案在公司各应用场景的落地。
1. 负责舆情监测系统中 NLP 相关任务的算法建模与优化,包括文本分类、情感分析、实体识别、语义理解、视频内容理解等模块,确保能够快速准确地从海量文本数据中提取有价值的信息,为舆情预警、趋势分析等应用提供坚实技术支撑。 2. 深入研究舆情数据特点,探索适合的 NLP 模型架构与算法策略,针对舆情文本的复杂性(如网络用语、多领域话题交织等),不断改进现有模型,提高模型泛化能力,使其能够应对多样化的舆情场景和数据变化。 3. 进行标注标准制定,协同标注人员构建高质量数据集,为算法训练提供基础数据,同时基于反馈数据持续优化算法效果,以数据驱动算法迭代。 4. 跟踪行业前沿技术动态与研究成果,如将大语言模型,多模态模型等应用于舆情分析场景。 5. 协助开发团队将算法成果工程化落地,确保模型在实际舆情监测系统中的高效稳定运行,参与算法性能的测试与评估工作,及时解决上线过程中出现的技术难题,保障系统稳定性。