logo of quark

夸克智能信息-语音大模型数据专家-杭州

社招全职1年以上运营-产品运营地点:杭州 | 上海状态:招聘

任职要求


1、语言学、语音学、计算语言学、语用学、心理学、汉语言等相关专业优先;
2、1-3年以上语音合成数据方向工作经验;熟悉智能语音交互场景和有声书场景相关经验者优先;
3、较强的分析和沟通能力,擅长从评估数据中发…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责语音大模型数据构建,设计各技术方案下各阶段数据方案与策略,建设专业、敏捷的流程&标准,管理高效高质的数据生产Pipeline,有效提升技术预研/业务落地效果;
2、负责端到端语音大模型评测体系建设,设计模型优化敏感、业务场景适配的评测方案与流程,建设并管理科学、敏捷的评测Pipeline,为模型效果提升提供有价值的优化方向与反馈;
3、推动跨团队合作,理解上游需求并统筹下游人力,负责项目资源的协调与组织,与算法/产品进行良好沟通,确保项目团队协同工作,推动语音方案在业务场景的落地。
包括英文材料
语音合成+
相关职位

logo of quark
社招3年以上技术类-算法

全面负责定义、设计并实现下一代对话系统的核心算法与交互范式,解决当前对话模型在多轮交互、知识应用、共情能力等方面的挑战,探索并引领模型在个性化、主动性、拟人化等前沿方向的技术突破。直接决定数亿夸克用户在Chat场景的与AI 的交互体验,塑造夸克在未来对话式 AI 时代的领先地位。 1. 对话体验定义与规划。深入分析用户意图与行为,结合业务场景,制定并执行对话体验的中长期技术演进路线图。并密切追踪并研究对话式 AI 领域的最新进展,包括主动式对话策略、多模态对话 (语音/视觉融合)、AI Agent 中的对话流控制等。您将主导定义“顶级对话体验”的标准,并将其分解为可落地、可量化的算法迭代目标。 2. 多轮对话与上下文理解。攻坚并解决长程、复杂多轮对话中的核心技术难题,包括但不限于指令遵循、上下文精准理解、长程记忆与遗忘机制、隐式意图识别等。您将设计创新的模型结构与训练策略,使模型具备真正连贯、有逻辑的对话能力。 3. 对话回复准确与全面。主导研发将外部知识 (如搜索、工具调用) 与大模型进行深度、动态融合的先进技术。致力于解决模型在对话中的意图偏离、事实性错误、内容不详实和知识更新不及时等问题,并通过 RAG 新范式或其他创新方法,显著提升对话的准确性与信息量。 4. 评测体系与数据飞轮。建立并完善一套科学、全面的对话能力评测体系,能够精准衡量模型的综合对话质量 (Coherence, Empathy, Informativeness 等)。设计并驱动高效的数据闭环系统,利用真实用户反馈持续、自动化地优化模型。

更新于 2025-12-08北京|杭州
logo of antgroup
社招3年以上技术类-算法

1. 大模型攻击研究 ● 针对大语言模型(LLM)、多模态模型(VLM)、智能体(Agent)等开展安全性与幻觉问题研究,系统化识别模型在对抗样本、越狱攻击、数据投毒、隐私泄露、注入、越权等方面的脆弱点; ● 设计并优化大模型对抗攻击算法,研究 Prompt 注入、自动化越狱策略与生成式数据增强方法,用于模拟实战攻击与安全性评估; ● 构建覆盖文本、图像、语音等多模态、agent场景的攻击方法库,支撑红队测试与模型安全基准建设。 2. 大模型防御机制 ● 研究大模型输入/输出层面的安全检测与防御机制,开发 Prompt 过滤、上下文改写、敏感内容抑制等方法; ● 构建跨模态、多层次的安全防护框架,提升 LLM/VLM/Agent 在实际应用中的鲁棒性。 3. 大模型安全对齐 ● 探索使用SFT、RL、MoE、RAG、Editing等对齐方法,提升模型的内生安全能力; ● 研究有害内容规避、幻觉抑制、安全对齐评测等关键技术,推动安全性融入模型全生命周期。 4. Agent 安全 ● 研究 Agent 在memory存储、多工具调用、链式推理中的攻击面与潜在风险,识别敏感数据泄露、工具滥用、意图篡改、海绵攻击等新型威胁; ● 设计 Agent 安全管控机制,包括权限控制、任务隔离、调用审计等,确保复杂场景下 Agent 的安全可控。

更新于 2025-09-23上海|杭州
logo of tongyi
社招5年以上技术类-开发

1. 主导面向ToB场景的Android端多模态交互系统架构设计与核心模块开发,包括语音采集/播放、摄像头控制、传感器融合、UI响应、状态管理等。 2. 与AI算法团队紧密协作,高效集成语音识别(ASR)、语音合成(TTS)、视觉理解(CV)、大语言模型(LLM)等端侧推理模块,优化模型加载、推理调度与资源协同策略。 3. 设计并实现低延迟、高并发的双工对话通道,支持实时打断、动态判停、上下文感知等高级交互能力在端侧的稳定运行。 4. 构建可扩展、可配置的SDK或中间件,支持多行业客户(如车企、手机厂商、IoT设备商)的快速接入与定制化需求。 5. 参与端云协同架构设计,在保障本地交互流畅性的同时,确保数据传输、存储与处理符合GDPR、CCPA、中国《个人信息保护法》等国内外隐私合规要求。 6. 深度集成系统级安全能力,包括应用权限管控、敏感操作审计、安全启动验证、密钥管理及安全OTA升级机制,提升端侧整体安全水位。

更新于 2026-01-19北京|杭州
logo of aliyun
社招技术类-算法

岗位职责: 该职位通过大模型训练、Agent、RAG、N2SQL、NLP、语音处理等技术创新和突破,构建Agent通用平台、大模型训练平台等工具产品,同时支持对话机器人等垂直应用及智能产品的建设。欢迎敢于接受挑战的候选人加入我们,一起赋能企业客户。我们的研究方向包括但不限于: 1、通用大模型、推理大模型预训练、微调、强化对齐等技术的持续研究创新; 2、多语言大模型、领域大模型的训练技术研究与落地; 3、AI数据清洗、加工、合成、自动标注技术研究与落地; 4、文本机器人、语音机器人、质检机器人等客服域技术的研发与落地; 5、多Agent、RAG、N2SQL、自主决策等技术的研究与落地; 6、入呼大模型机器人、外呼大模型机器人研发经验;熟悉VAD, ASR, TTS等语音相关技术; 以上方向擅长其中1个即可

更新于 2025-06-10北京|杭州