夸克智能信息-语音大模型数据专家-杭州

社招全职1年以上运营-产品运营2025-10-16地点：杭州 | 上海状态：招聘

扫码手机上打开

任职要求

1、语言学、语音学、计算语言学、语用学、心理学、汉语言等相关专业优先；
2、1-3年以上语音合成数据方向工作经验；熟悉智能语音交互场景和有声书场景相关经验者优先；
3、较强的分析和沟通能力，擅长从评估数据中发…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责语音大模型数据构建，设计各技术方案下各阶段数据方案与策略，建设专业、敏捷的流程&标准，管理高效高质的数据生产Pipeline，有效提升技术预研/业务落地效果；
2、负责端到端语音大模型评测体系建设，设计模型优化敏感、业务场景适配的评测方案与流程，建设并管理科学、敏捷的评测Pipeline，为模型效果提升提供有价值的优化方向与反馈；
3、推动跨团队合作，理解上游需求并统筹下游人力，负责项目资源的协调与组织，与算法/产品进行良好沟通，确保项目团队协同工作，推动语音方案在业务场景的落地。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

语音合成+

相关职位

AI创新事业部-语音大模型数据评测专家-未来生活实验室

社招3年以上技术类-综合

1、搭建具有通用性和可拓展性的语音大模型数据标注和模型评测框架（NLP、TTS、ASR等方向），与算法团队对齐标准、撰写相关培训方案，根据模型迭代方向提供高质量数据，对自动化链路搭建、数据质量评估及外部资源管理负责； 2、结合行业趋势及业务应用场景，迭代更新评测标准、构建评测题库，负责语音大模型效果评测，定期反馈评估结果，产出评估报告，确保大模型评估结果置信； 3、通过PE、代码、Workflow、Agent完成数据预处理、分析和清洗，按照训练需求进行标注、分析和验证调优，提升模型效果； 4、与产品算法团队协同，积极探索自动化数据生产/模型评估、数据合成等方法，提高数据标注/评测效率，持续跟踪大模型技术进展，持续探索智能高效的数据生产模式。

更新于 2026-04-03北京|杭州

智能信息-千问/夸克-大模型高级算法专家-Chat方向

社招3年以上技术类-算法

全面负责定义、设计并实现下一代对话系统的核心算法与交互范式，解决当前对话模型在多轮交互、知识应用、共情能力等方面的挑战，探索并引领模型在个性化、主动性、拟人化等前沿方向的技术突破。直接决定数亿夸克用户在Chat场景的与AI 的交互体验，塑造夸克在未来对话式 AI 时代的领先地位。 1. 对话体验定义与规划。深入分析用户意图与行为，结合业务场景，制定并执行对话体验的中长期技术演进路线图。并密切追踪并研究对话式 AI 领域的最新进展，包括主动式对话策略、多模态对话 (语音/视觉融合)、AI Agent 中的对话流控制等。您将主导定义“顶级对话体验”的标准，并将其分解为可落地、可量化的算法迭代目标。 2. 多轮对话与上下文理解。攻坚并解决长程、复杂多轮对话中的核心技术难题，包括但不限于指令遵循、上下文精准理解、长程记忆与遗忘机制、隐式意图识别等。您将设计创新的模型结构与训练策略，使模型具备真正连贯、有逻辑的对话能力。 3. 对话回复准确与全面。主导研发将外部知识 (如搜索、工具调用) 与大模型进行深度、动态融合的先进技术。致力于解决模型在对话中的意图偏离、事实性错误、内容不详实和知识更新不及时等问题，并通过 RAG 新范式或其他创新方法，显著提升对话的准确性与信息量。 4. 评测体系与数据飞轮。建立并完善一套科学、全面的对话能力评测体系，能够精准衡量模型的综合对话质量 (Coherence, Empathy, Informativeness 等)。设计并驱动高效的数据闭环系统，利用真实用户反馈持续、自动化地优化模型。

更新于 2025-12-08北京|杭州

蚂蚁集团-大模型安全算法专家-杭州/上海

社招3年以上技术类-算法

1. 大模型攻击研究 ● 针对大语言模型（LLM）、多模态模型（VLM）、智能体（Agent）等开展安全性与幻觉问题研究，系统化识别模型在对抗样本、越狱攻击、数据投毒、隐私泄露、注入、越权等方面的脆弱点； ● 设计并优化大模型对抗攻击算法，研究 Prompt 注入、自动化越狱策略与生成式数据增强方法，用于模拟实战攻击与安全性评估； ● 构建覆盖文本、图像、语音等多模态、agent场景的攻击方法库，支撑红队测试与模型安全基准建设。 2. 大模型防御机制 ● 研究大模型输入/输出层面的安全检测与防御机制，开发 Prompt 过滤、上下文改写、敏感内容抑制等方法； ● 构建跨模态、多层次的安全防护框架，提升 LLM/VLM/Agent 在实际应用中的鲁棒性。 3. 大模型安全对齐 ● 探索使用SFT、RL、MoE、RAG、Editing等对齐方法，提升模型的内生安全能力； ● 研究有害内容规避、幻觉抑制、安全对齐评测等关键技术，推动安全性融入模型全生命周期。 4. Agent 安全 ● 研究 Agent 在memory存储、多工具调用、链式推理中的攻击面与潜在风险，识别敏感数据泄露、工具滥用、意图篡改、海绵攻击等新型威胁； ● 设计 Agent 安全管控机制，包括权限控制、任务隔离、调用审计等，确保复杂场景下 Agent 的安全可控。

更新于 2025-09-23上海|杭州

数据技术及产品部-AI 语音领域数据架构师-杭州/北京

社招5年以上技术类-数据

负责搭建并管理面向语音领域大模型的全链路数据体系，包括数据评测、加工、合成与标注。作为模型算法团队与数据采集团队的核心桥梁，确保高质量、多样化数据供给。主要包括以下： 1. 评测体系构建：主导音频领域大模型的评测标准制定，建立涵盖理解、生成、对齐、安全四大维度的评估框架，设计人工评测与自动评测相结合的混合评估方案，搭建评测数据集、生产管线，建立与SOTA模型的对比评测机制，输出专业评测报告。 2. 数据链路架构：构建大规模语音训练数据的全生命周期处理链路：采集→清洗→去重→质量筛选→格式标准化→安全过滤，搭建数据质量监控体系，建立数据价值评估模型，确保高信息密度数据的持续供给； 3. 标注规范与质量体系：制定细粒度多模态标注规范；建立分层质检机制确保标注的质量；设计标注人员培训体系与能力认证标准，搭建领域专家标注团队。

更新于 2026-04-03北京|杭州