logo of quark

夸克智能信息-大模型数据专家-智能语音方向

社招全职3年以上技术类-开发地点:杭州 | 北京状态:招聘

任职要求


1、计算机及相关专业本科及以上学历,良好的沟通和团队协作能力; 
2、扎实的编程基础、良好的编程风格,熟悉多线程编程、分布式计算、网络通信、内存管理、设计模式; 
3、3年以上工程研发或者基础架构经验,熟练掌握C/C++PythonGolang等至少一种开发语言; 
4、熟悉多项大数据处理/分析相关的工具/框架,例如Hadoop、HDFS、Hive、MapRed…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与设计并实现高性能、可扩展、分布式大数据处理平台,通过数据驱动模型训练,支撑夸克智能语音相关业务算法生产与高效迭代; 
2、与算法工程师密切配合,理解深度学习模型研发流程,负责/参与前沿模型研究中数据解决方案的设计、开发和维护; 
3、通过AI能力来赋能数据建设,持续提升平台数据生产效率、易用性、降低算法使用成本
包括英文材料
数据结构+
算法+
内核+
大模型+
学历+
多线程+
设计模式+
C+
C+++
Python+
Go+
Hadoop+
还有更多 •••
相关职位

logo of quark
社招1年以上运营-产品运营

1、负责语音大模型数据构建,设计各技术方案下各阶段数据方案与策略,建设专业、敏捷的流程&标准,管理高效高质的数据生产Pipeline,有效提升技术预研/业务落地效果; 2、负责端到端语音大模型评测体系建设,设计模型优化敏感、业务场景适配的评测方案与流程,建设并管理科学、敏捷的评测Pipeline,为模型效果提升提供有价值的优化方向与反馈; 3、推动跨团队合作,理解上游需求并统筹下游人力,负责项目资源的协调与组织,与算法/产品进行良好沟通,确保项目团队协同工作,推动语音方案在业务场景的落地。

更新于 2025-10-16杭州|上海
logo of quark
社招2年以上技术类-算法

1. 操控万卡规模的 GPU 集群,对超大参数量级的预训练模型进行高效分布式训练与优化。 2.深度参与多模态(图像、语音、文本、视频)大模型的研发,探索多学科交叉领域的新奇玩法。 3.我们的技术将为夸克亿万用户提供高品质的AI智能服务,见证前沿技术实现真正的用户价值 加入我们,你将获得: 1.与顶级专家携手,以世界级算力资源和数据支持为背书,不断挑战技术极限。 2.极具竞争力的薪酬与福利,人性化、追求卓越技术的的工程师团队文化,助你在职业成长道路上全速前进。 3.在通往 AGI 的征途上,亲历关键技术的诞生与应用,留下属于你的时代印记。 如果你渴望驰骋在大模型与 AGI 的蓝海之中,那么这将是你的最佳舞台!快来加入我们,一同开创智能时代的新纪元。

更新于 2025-11-05北京|杭州
logo of quark
社招3年以上技术类-算法

全面负责定义、设计并实现下一代对话系统的核心算法与交互范式,解决当前对话模型在多轮交互、知识应用、共情能力等方面的挑战,探索并引领模型在个性化、主动性、拟人化等前沿方向的技术突破。直接决定数亿夸克用户在Chat场景的与AI 的交互体验,塑造夸克在未来对话式 AI 时代的领先地位。 1. 对话体验定义与规划。深入分析用户意图与行为,结合业务场景,制定并执行对话体验的中长期技术演进路线图。并密切追踪并研究对话式 AI 领域的最新进展,包括主动式对话策略、多模态对话 (语音/视觉融合)、AI Agent 中的对话流控制等。您将主导定义“顶级对话体验”的标准,并将其分解为可落地、可量化的算法迭代目标。 2. 多轮对话与上下文理解。攻坚并解决长程、复杂多轮对话中的核心技术难题,包括但不限于指令遵循、上下文精准理解、长程记忆与遗忘机制、隐式意图识别等。您将设计创新的模型结构与训练策略,使模型具备真正连贯、有逻辑的对话能力。 3. 对话回复准确与全面。主导研发将外部知识 (如搜索、工具调用) 与大模型进行深度、动态融合的先进技术。致力于解决模型在对话中的意图偏离、事实性错误、内容不详实和知识更新不及时等问题,并通过 RAG 新范式或其他创新方法,显著提升对话的准确性与信息量。 4. 评测体系与数据飞轮。建立并完善一套科学、全面的对话能力评测体系,能够精准衡量模型的综合对话质量 (Coherence, Empathy, Informativeness 等)。设计并驱动高效的数据闭环系统,利用真实用户反馈持续、自动化地优化模型。

更新于 2025-11-10北京|杭州
logo of bytedance
社招3年以上A156693

1、搭建具有通用性和可拓展性的NLP标注框架,与算法团队对齐标准、撰写相关培训方案,根据模型迭代方向提供高质量数据; 2、负责大语言模型训练过程中各阶段数据生产,对自动化链路搭建、数据质量评估及外部资源管理负责,确保大语言模型训练数据有效; 3、能通过PE、代码完成数据预处理、分析和清洗,按照训练需求进行标注、分析和验证调优,提升模型效果; 4、与产品算法团队协同,积极探索自动化数据生产、数据合成等方法,提高数据标注效率,持续跟踪大模型技术进展,持续探索智能高效的数据生产模式。

更新于 2025-05-20北京