字节跳动大模型知识图谱算法工程师-飞书
任职要求
1、具备NLP、LLM应用或RAG其中一个方向的相关经验,具备较强的编程能力; 2、有较强的评测意识和科学的评测思路; 3、有较强的创新能力,有不断探索新AI技术和应用场景的强烈意愿和主观能动性; 4、能紧跟AI领域的最新发展动态,通过参加学术会议、阅读前沿论文、在线学习课程等方式,不断提升自己的专业知识和技能; 5、有较强的解决问题能力,善于解决各种繁琐的技术问题(如:数据质量问题、训练问题、部署兼容性问题等); 6、对数据比较敏感,能细致完成数据工作,包括数据质量、数据分布、案例分析、数据调优等。 加分项: 1、有过比较深入的GraphRAG或类似经验; 2、在垂直场景(如:法务/供应链领域知识管理)有过成熟的案例沉淀; 3、在复杂知识管理场景上,做过多源异构知识的统一处理; 4、有处理音/视/图/文档的多模态相关经验。
工作职责
1、知识图谱构建:负责设计和构建企业级知识图谱,解决协同场景(人、任务、文档、会议)以及跨业务系统的信息孤岛,实现知识的互联互通,为企业建立统一高效的知识管理体系,更好的支持LLM落地 2、围绕Graph探索LLM新应用模式:基于企业知识图谱,探索RAG/Agent的落地新范式,使其能够在复杂的企业知识网络中进行精准的信息检索、关联分析和逻辑推理; 3、模型迭代与优化:持续优化大语言模型及RAG系统在企业知识管理领域的表现,构建针对性的评测方法,生产和维护高质量的企业领域数据集; 4、前沿技术研究与应用:密切关注知识图谱、LLM推理等领域的最新研究成果,将前沿技术应用于企业知识管理实践中。
1、团队涉及向多个业务方(飞书问答/Aily/豆包/Coze)提供RAG相关的底层算法/算子; 2、NLU:多轮问答Query总结,Query拆解,Query意图识别,相关Query推荐; 3、召回排序:相关性向量召回,相关性排序,多因子排序(时效性、权威性、互动性); 4、LLM生成优化:Prompt调优,生成大模型SFT/RLHF; 5、索引构建:Image2Text、多模态Embedding、端侧Embedding技术、知识图谱挖掘与应用; 6、跟踪业界前沿技术的发展,探索深度学习/LLM等前沿技术的应用前景。
团队介绍:字节跳动质量技术团队,聚焦质量领域,提供一系列的稳定的、有效的、技术领先的质量产品和工具,支撑电商、抖音、今日头条、飞书等业务。当前,我们在积极的探索质量基建与大模型的结合,构建更高效、更智能的质量技术,非常期望有更多的人才加入,在质量内建、测试效能、自动化测试等领域取得前沿的技术突破。 1、负责大模型技术在软件智能交付领域的相关应用技术研发,业务场景包括但不限于知识图谱、代码生成、智能交互、风险预测挖掘、智能归因、缺陷修复、故障自愈; 2、洞察AIGC等前沿技术领域的最新研究成果,探索工业领域落地可行性,并持续提升算法应用效果; 3、探索大模型技术在研发效能领域中的落地应用,为研发效率提升提供智能服务; 4、深度参与项目研发,与产品和业务团队同学保持密切配合,不断优化项目整体效益,提升用户体验。
1..协助团队做AI智能体的知识挖掘相关的算法工作,涉及到非结构化数据的实体识别和关系抽取,以及图推理和图查询算法的开发。 2. 协助团队做知识打标工作中的无监督、半监督算法的开发,提升数据打标的效率。 3. 协助团队构建实验流程,包括但不限于,梳理数据标注逻辑、工具需求,验证和评估实验回收数据,并总结成工具需求。 4. 协助团队做算法调研,包括但不限于,整理相关领域算法当前SOTA的实现或者文章,并做对比分析。