夸克智能信息-大模型数据专家-LLM方向
任职要求
1、编程基本功扎实、熟悉常用数据结构和算法,有大规模、分布式数据处理的经验; 2、有面向大模型训练、或AI搜索/chat等创新业务的数据开发经验; 3、熟悉网页、文档的数据采集和处理技术,并能应用AI能力来不断优化数据效果; 4、具备在 CPU 和 GPU 上优化及并行化数据处理流程的能力; 加分项: 1、有前沿模型研发经验,涉及数据、评估、平台相关工作; 2、具有网页或文档解析效果优化经验; 3、熟悉PyTorch深度学习框架,了解常见的深度学习算法。
工作职责
1、参与境内外互联网网页、文档、代码等文本数据的发现、采集、处理及标注工作,完善相应平台和架构能力; 2、为文本大模型训练供给语料数据,为AI toC应用供给领域优质内容数据; 3、评估并提升训练数据的质量、多样性及标注准确性; 4、通过AI能力来赋能数据建设,提升数据效果及生产效率; 5、与模型及业务研发团队紧密协作,根据训练效果和业务指标反馈持续迭代数据策略。
夸克学习算法团队致力于使用AI技术重塑面向未来的学习体验。在这里您将与我们一起挑战前沿的产品技术问题,并收获服务千万级用户的成就感和影响力。 核心职责: 1. 主导教育场景下多模态大模型(文本/图像/视频)的全流程算法研发工作,包括数据构建、指令微调、RLVR、RLHF等关键环节 2. 针对教学场景设计专属后训练与微调方案(如解题步骤生成、作业批改、互动答疑等),提升核心模型的专业性与可用性 3. 跟进业界最新进展和SOTA模型和算法,并与教育场景特点进行深度结合,推动智能化教学和个性化学习落地
1. 跟进大模型的前沿进展,负责大模型在百亿级流量搜索和信息流广告客户侧的应用和优化; 2. 跟进和研究前沿AI Agent技术,负责效果广告系统AI Assistant、投放AI Agent的研究和落地; 3. 构建商业Agent生态基础技术平台能力,包括Prompt、RAG、LLMs(预训练、微调、RLHF等)、数据、评测、agent框架等;
全面负责定义、设计并实现下一代对话系统的核心算法与交互范式,解决当前对话模型在多轮交互、知识应用、共情能力等方面的挑战,探索并引领模型在个性化、主动性、拟人化等前沿方向的技术突破。直接决定数亿夸克用户在Chat场景的与AI 的交互体验,塑造夸克在未来对话式 AI 时代的领先地位。 1. 对话体验定义与规划。深入分析用户意图与行为,结合业务场景,制定并执行对话体验的中长期技术演进路线图。并密切追踪并研究对话式 AI 领域的最新进展,包括主动式对话策略、多模态对话 (语音/视觉融合)、AI Agent 中的对话流控制等。您将主导定义“顶级对话体验”的标准,并将其分解为可落地、可量化的算法迭代目标。 2. 多轮对话与上下文理解。攻坚并解决长程、复杂多轮对话中的核心技术难题,包括但不限于指令遵循、上下文精准理解、长程记忆与遗忘机制、隐式意图识别等。您将设计创新的模型结构与训练策略,使模型具备真正连贯、有逻辑的对话能力。 3. 对话回复准确与全面。主导研发将外部知识 (如搜索、工具调用) 与大模型进行深度、动态融合的先进技术。致力于解决模型在对话中的意图偏离、事实性错误、内容不详实和知识更新不及时等问题,并通过 RAG 新范式或其他创新方法,显著提升对话的准确性与信息量。 4. 评测体系与数据飞轮。建立并完善一套科学、全面的对话能力评测体系,能够精准衡量模型的综合对话质量 (Coherence, Empathy, Informativeness 等)。设计并驱动高效的数据闭环系统,利用真实用户反馈持续、自动化地优化模型。
我们正在构建世界级医疗垂直大模型,致力于通过AGI技术革新健康咨询与辅助诊疗场景,让精准医疗普惠每个家庭。如果你渴望在万卡算力集群上实现算法突破,用技术改变14亿人的生命质量,这是你不可错过的技术圣战。加入我们,定义医疗大模型的未来。 1. 负责后训练(Post-training)相关研发工作,提升模型在推理、Planning、RAG、指令跟随、工具调用等方面的能力; 2. 优化和迭代大模型的对齐训练策略,包括 SFT、RLHF、Self-play RL、Agent 优化等; 3. 对齐人类偏好、安全性,提升奖励信号的质量和多样性,解决 Reward Hacking 和奖励融合问题 4. 参与数据飞轮、数据合成、基准集合建设、评测工具的开发与发布等。