夸克智能信息-大模型强化学习专家(医疗AGI)-杭州/北京
任职要求
1. 计算机、人工智能等相关专业硕士以上学历,3年以上相关工作经验。 2. 熟悉强化学习,有成功的落地项目案例。了解大…
工作职责
1.深入探索LLM在医疗问答场景(如多轮对话、智能诊断)中的效果提升方案,推动行业前沿技术在业务中规模化应用。构建面向医疗领域的强化学习训练框架,设计合理的Reward Model,通过PPO/GRPO等算法实现模型对齐与可控生成。 2.结合消融实验和归因分析,定位影响模型效果的关键因素,制定分层优化策略 3.参与制定数据标注标准,参与构建多维度评测体系。负责从数据挖掘、RL训练策略设计、模型调优到效果评估的全流程开发,持续提升模型在医疗业务上的表现。
-致力于打造业界领先的医疗大模型对话系统。通过持续的技术创新和优化,成功构建了一套完整的医疗智能对话解决方案 -数据合成:负责领域知识和训练数据的构建与维护,利用数据飞轮机制不断优化数据质量和丰富度,提升模型性能和应用效果 -大模型训练:针对业务需求进行大模型的继续训练、有监督微调和强化学习,以及多模态模型训练,实现模型在垂直领域的深度适配,与业务专家合作,构建和优化结构化的提示词系统,利用COT等先进技术增强大模型的推理能力,高效、精准解决实际问题 -信息检索:开发和优化Query理解、语义索引、相关性排序等技术,提升RAG的效果,实现大模型与知识库的深度融合,基于领先的智能体框架,运用并增强大模型的推理、对话和反思能力,解决复杂业务问题 -大模型评测:制定和实施全方位的大模型评估方案,结合人工评估和自动化评估手段,建立完整的评测体系,确保模型性能的可靠性和稳定性 -应用落地:深入理解业务痛点,定义问题解决方案,设定任务标准和目标,通过持续的技术创新和优化,实现最佳的业务效果和用户体验
-致力于打造业界领先的医疗大模型对话系统。通过持续的技术创新和优化,成功构建了一套完整的医疗智能对话解决方案 -数据合成:负责领域知识和训练数据的构建与维护,利用数据飞轮机制不断优化数据质量和丰富度,提升模型性能和应用效果 -大模型训练:针对业务需求进行大模型的继续训练、有监督微调和强化学习,以及多模态模型训练,实现模型在垂直领域的深度适配,与业务专家合作,构建和优化结构化的提示词系统,利用COT等先进技术增强大模型的推理能力,高效、精准解决实际问题 -信息检索:开发和优化Query理解、语义索引、相关性排序等技术,提升RAG的效果,实现大模型与知识库的深度融合,基于领先的智能体框架,运用并增强大模型的推理、对话和反思能力,解决复杂业务问题 -的可靠性和稳定性 -应用落地:深入理解业务痛点,定义问题解决方案,设定任务标准和目标,通过持续的技术创新和优化,实现最佳的业务效果和用户体验
通过强化学习提升万亿级参数大模型的决策认知能力,实现大模型在复杂环境下的多模态交互,完成多轮感知-决策闭环,在前沿实践中推动AGI落地; 研发新一代大模型强化学习算法,提升大模型在多模态、工具调用、复杂环境交互、多智能体交互等方向的基础能力; 改进大规模分布式强化学习框架,优化万卡集群下的高效分布式训练效率,支持大模型与复杂环境/工具的高效交互; 将强化学习研究成果融入夸克产品生态,打造更懂用户的智能服务产品, 让前沿技术惠及亿万用户。