字节跳动RAG算法工程师-飞书/Aily/豆包
任职要求
1、优秀的的代码能力、数据结构和基础算法功底; 2、出色的分析问题、解决问题能力,总是能从纷繁复杂的数据中一眼看出问题本质; 3、熟悉自然语言处理的实体提取、意图识别、事件摘要、语义分析、新词发现、图文数据分类等相关任务,并有深入的实践经验; 4、熟悉深度学习的原理和实现,熟练掌握Tensorflow/Torch/Keras等至少一种深度学框架; 5、参与过推荐系统、搜索、问答等实际项目的开发,有丰富的架构设计、特征工程建设等方面经验,熟练掌握基本的召回和排序算法,并对领域前沿算法有研究; 6、责任心强,积极主动,有良好的沟通能力和团队合作能力。
工作职责
1、团队涉及向多个业务方(飞书问答/Aily/豆包/Coze)提供RAG相关的底层算法/算子; 2、NLU:多轮问答Query总结,Query拆解,Query意图识别,相关Query推荐; 3、召回排序:相关性向量召回,相关性排序,多因子排序(时效性、权威性、互动性); 4、LLM生成优化:Prompt调优,生成大模型SFT/RLHF; 5、索引构建:Image2Text、多模态Embedding、端侧Embedding技术、知识图谱挖掘与应用; 6、跟踪业界前沿技术的发展,探索深度学习/LLM等前沿技术的应用前景。
1、业务应用:负责将自研的算法模型应用于企业协同软件中,在会议、文档、消息、办公智能体等诸多办公场景中打造最好的AI工具和产品,不断改善用户体验; 2、模型优化:负责训练大语言模型不断提高其在办公领域的算法质量;建设高效的评测方法和技术体系;采集、调研并生产办公领域的高质量数据集; 3、技术建设:持续关注业界最新的技术趋势和研究成果,分享行业最佳实践,将前沿技术应用于大模型中。
1、业务应用:负责将自研的算法模型应用于企业协同软件中,在会议、文档、消息、办公智能体等诸多办公场景中打造最好的AI工具和产品,不断改善用户体验; 2、模型优化:负责训练大语言模型不断提高其在办公领域的算法质量;建设高效的评测方法和技术体系;采集、调研并生产办公领域的高质量数据集; 3、技术建设:持续关注业界最新的技术趋势和研究成果,分享行业最佳实践,将前沿技术应用于大模型中。
1、业务应用:负责将自研的算法模型应用于企业协同软件中,在会议、文档、消息、办公智能体等诸多办公场景中打造最好的AI工具和产品,不断改善用户体验; 2、模型优化:负责训练大语言模型不断提高其在办公领域的算法质量;建设高效的评测方法和技术体系;采集、调研并生产办公领域的高质量数据集; 3、技术建设:持续关注业界最新的技术趋势和研究成果,分享行业最佳实践,将前沿技术应用于大模型中。
1、知识图谱构建:负责设计和构建企业级知识图谱,解决协同场景(人、任务、文档、会议)以及跨业务系统的信息孤岛,实现知识的互联互通,为企业建立统一高效的知识管理体系,更好的支持LLM落地 2、围绕Graph探索LLM新应用模式:基于企业知识图谱,探索RAG/Agent的落地新范式,使其能够在复杂的企业知识网络中进行精准的信息检索、关联分析和逻辑推理; 3、模型迭代与优化:持续优化大语言模型及RAG系统在企业知识管理领域的表现,构建针对性的评测方法,生产和维护高质量的企业领域数据集; 4、前沿技术研究与应用:密切关注知识图谱、LLM推理等领域的最新研究成果,将前沿技术应用于企业知识管理实践中。