logo of aligenie

智能互联数据技术及产品部-AI 语音领域数据架构师-杭州/北京

社招全职5年以上技术类-数据地点:北京 | 杭州状态:招聘

任职要求


1.  计算机科学、人工智能等相关专业,或语音学、语义学等交叉学科背景,硕士及以上学历优先。
2.  5年以上AI数据相关经验,至少2年大模型LLM/VLM)数据工作经验;有从0到1搭建数据团队或平台的经历;懂模型、懂数据、有产品 sense ,具备 AI 协同能力。
3.  技术深度:深入大模型原理;精通数据清洗与质量评估方法…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责搭建并管理面向语音领域大模型的全链路数据体系,包括数据评测、加工、合成与标注。作为模型算法团队与数据采集团队的核心桥梁,确保高质量、多样化数据供给。主要包括以下:

1.  评测体系构建:主导音频领域大模型的评测标准制定,建立涵盖理解、生成、对齐、安全四大维度的评估框架,设计人工评测与自动评测相结合的混合评估方案,搭建评测数据集、生产管线,建立与SOTA模型的对比评测机制,输出专业评测报告。
2.  数据链路架构:构建大规模语音训练数据的全生命周期处理链路:采集→清洗→去重→质量筛选→格式标准化→安全过滤,搭建数据质量监控体系,建立数据价值评估模型,确保高信息密度数据的持续供给;
3.  标注规范与质量体系:制定细粒度多模态标注规范;建立分层质检机制确保标注的质量;设计标注人员培训体系与能力认证标准,搭建领域专家标注团队。
包括英文材料
学历+
大模型+
还有更多 •••
相关职位

logo of baidu
校招AIDU项目

-负责大模型应用层算法研发与调优,负责对话系统、内容生成、意图理解等核心模块的算法优化,基于LLM深入理解用户所需,提升模型在复杂场景下的推理能力与用户体验; -构建用户-内容动态匹配算法,开发结合大模型能力的个性化推荐系统;研发文本/语音/视觉多模态融合算法,探索新型人机交互范式在移动端的最佳实践,带动产品规模高速增长。

更新于 2025-06-23北京
logo of bytedance
实习A63598

团队介绍:Intelligence and Innovation团队,是飞书部门内部负责做算法创新与实践的部门,深耕于ToB办公场景的LLM应用相关的前沿技术探索与落地。既通过ASR、大模型文本总结、智能函数、多模态等AI中台能力的建设来支持飞书内外语音识别、会议纪要生成、智能表格公式等各类AI产品,同时也负责了企业AI搜索与知识管理等业务的落地和推广,团队目标是将飞书打造为AI与人高效协作的下一代智能平台,实现 “有效率、有方法、有结果” 的产品愿景。 课题背景: 飞书沉淀了企业内大量知识(文档、wiki、消息、会议记录、图片、视频等)。随着企业知识图谱、用户行为轨迹等图结构数据规模的指数级增长,传统基于文本匹配的RAG系统面临关系感知缺失和个性化能力不足的矛盾。如何寻找相对开销低、效果好的企业问答RAG新范式,突破现有系统在跨模态意图理解深度、个性化排序精度与实时生成质量上的瓶颈,基于企业内部知识和外部公网知识来回答问题与完成深度创作,这项工作对于字节自身做好企业知识管理,和飞书打造国内领先的企业知识问答创作产品,都有重要意义。 课题挑战: 1、图结构融合挑战:传统RAG系统以文本匹配为核心,难以有效捕获用户行为模式、实体拓扑关系等非结构化图信息。如何将文本、图像、视频等异构图数据嵌入到语义理解框架中,构建统一的特征表示空间,是提升意图识别精度的关键瓶颈; 2、动态推理挑战:企业关系图谱具有实时演化特性,用户行为模式与实体关联强度随时间动态变化。现有静态图嵌入方法难以满足实时问答场景的时效性要求,需要开发增量式图学习算法实现动态知识更新; 3、企业内部知识和外部公网知识的融合:当两种知识之间存在差异或冲突时,如果无法有效融合,会显著降低回答的可靠性和实用性。如何在不同模态间建立准确的语义关联,并有效融合内外部知识,是提升回答可靠性和实用性的关键。虽然业界 Deep Research 实现了基于 Agent 架构的公网知识深度检索与创作,但尚无企业内外部知识融合的成功实践; 4、Agentic RAG 可控性:基于Agent架构来实现企业知识问答创作,依赖LLM进行自主推理和判断,其决策过程存在一定的不可预测性。在某些复杂情况下(召回语料量大且干扰性强、企业内部知识与外部知识冲突),Agent可能做出不符合预期的决策,且难以直接干预和纠正。 我们的优势: 1、飞书企业问答产品已经积累了一定的用户基础,并在快速增长; 2、依托飞书套件,能够建立比较完整的用户与其他飞书内实体的图结构数据,并且已经有过早期实践(Lark Graph); 3、飞书企业问答有完整的评测体系和资源,帮助RAG类探索快速迭代。

更新于 2025-03-04北京
logo of bytedance
实习A231113

团队介绍:Intelligence and Innovation团队,是飞书部门内部负责做算法创新与实践的部门,深耕于ToB办公场景的LLM应用相关的前沿技术探索与落地。既通过ASR、大模型文本总结、智能函数、多模态等AI中台能力的建设来支持飞书内外语音识别、会议纪要生成、智能表格公式等各类AI产品,同时也负责了企业AI搜索与知识管理等业务的落地和推广,团队目标是将飞书打造为AI与人高效协作的下一代智能平台,实现 “有效率、有方法、有结果” 的产品愿景。 课题背景: 飞书沉淀了企业内大量知识(文档、wiki、消息、会议记录、图片、视频等)。随着企业知识图谱、用户行为轨迹等图结构数据规模的指数级增长,传统基于文本匹配的RAG系统面临关系感知缺失和个性化能力不足的矛盾。如何寻找相对开销低、效果好的企业问答RAG新范式,突破现有系统在跨模态意图理解深度、个性化排序精度与实时生成质量上的瓶颈,基于企业内部知识和外部公网知识来回答问题与完成深度创作,这项工作对于字节自身做好企业知识管理,和飞书打造国内领先的企业知识问答创作产品,都有重要意义。 课题挑战: 1、图结构融合挑战:传统RAG系统以文本匹配为核心,难以有效捕获用户行为模式、实体拓扑关系等非结构化图信息。如何将文本、图像、视频等异构图数据嵌入到语义理解框架中,构建统一的特征表示空间,是提升意图识别精度的关键瓶颈; 2、动态推理挑战:企业关系图谱具有实时演化特性,用户行为模式与实体关联强度随时间动态变化。现有静态图嵌入方法难以满足实时问答场景的时效性要求,需要开发增量式图学习算法实现动态知识更新; 3、企业内部知识和外部公网知识的融合:当两种知识之间存在差异或冲突时,如果无法有效融合,会显著降低回答的可靠性和实用性。如何在不同模态间建立准确的语义关联,并有效融合内外部知识,是提升回答可靠性和实用性的关键。虽然业界 Deep Research 实现了基于 Agent 架构的公网知识深度检索与创作,但尚无企业内外部知识融合的成功实践; 4、Agentic RAG 可控性:基于Agent架构来实现企业知识问答创作,依赖LLM进行自主推理和判断,其决策过程存在一定的不可预测性。在某些复杂情况下(召回语料量大且干扰性强、企业内部知识与外部知识冲突),Agent可能做出不符合预期的决策,且难以直接干预和纠正。 我们的优势: 1、飞书企业问答产品已经积累了一定的用户基础,并在快速增长; 2、依托飞书套件,能够建立比较完整的用户与其他飞书内实体的图结构数据,并且已经有过早期实践(Lark Graph); 3、飞书企业问答有完整的评测体系和资源,帮助RAG类探索快速迭代。

更新于 2025-03-04上海
logo of bytedance
实习A22726

团队介绍:Intelligence and Innovation团队,是飞书部门内部负责做算法创新与实践的部门,深耕于ToB办公场景的LLM应用相关的前沿技术探索与落地。既通过ASR、大模型文本总结、智能函数、多模态等AI中台能力的建设来支持飞书内外语音识别、会议纪要生成、智能表格公式等各类AI产品,同时也负责了企业AI搜索与知识管理等业务的落地和推广,团队目标是将飞书打造为AI与人高效协作的下一代智能平台,实现 “有效率、有方法、有结果” 的产品愿景。 课题背景: 飞书沉淀了企业内大量知识(文档、wiki、消息、会议记录、图片、视频等)。随着企业知识图谱、用户行为轨迹等图结构数据规模的指数级增长,传统基于文本匹配的RAG系统面临关系感知缺失和个性化能力不足的矛盾。如何寻找相对开销低、效果好的企业问答RAG新范式,突破现有系统在跨模态意图理解深度、个性化排序精度与实时生成质量上的瓶颈,基于企业内部知识和外部公网知识来回答问题与完成深度创作,这项工作对于字节自身做好企业知识管理,和飞书打造国内领先的企业知识问答创作产品,都有重要意义。 课题挑战: 1、图结构融合挑战:传统RAG系统以文本匹配为核心,难以有效捕获用户行为模式、实体拓扑关系等非结构化图信息。如何将文本、图像、视频等异构图数据嵌入到语义理解框架中,构建统一的特征表示空间,是提升意图识别精度的关键瓶颈; 2、动态推理挑战:企业关系图谱具有实时演化特性,用户行为模式与实体关联强度随时间动态变化。现有静态图嵌入方法难以满足实时问答场景的时效性要求,需要开发增量式图学习算法实现动态知识更新; 3、企业内部知识和外部公网知识的融合:当两种知识之间存在差异或冲突时,如果无法有效融合,会显著降低回答的可靠性和实用性。如何在不同模态间建立准确的语义关联,并有效融合内外部知识,是提升回答可靠性和实用性的关键。虽然业界 Deep Research 实现了基于 Agent 架构的公网知识深度检索与创作,但尚无企业内外部知识融合的成功实践; 4、Agentic RAG 可控性:基于Agent架构来实现企业知识问答创作,依赖LLM进行自主推理和判断,其决策过程存在一定的不可预测性。在某些复杂情况下(召回语料量大且干扰性强、企业内部知识与外部知识冲突),Agent可能做出不符合预期的决策,且难以直接干预和纠正。 我们的优势: 1、飞书企业问答产品已经积累了一定的用户基础,并在快速增长; 2、依托飞书套件,能够建立比较完整的用户与其他飞书内实体的图结构数据,并且已经有过早期实践(Lark Graph); 3、飞书企业问答有完整的评测体系和资源,帮助RAG类探索快速迭代。

更新于 2025-03-04深圳