蚂蚁金服蚂蚁集团-医疗大模型训练算法-健康事业群
任职要求
1. 熟悉并实操大模型的预训练(Pre-training)、微调(Fine-tuning)、后训练(Post-training)全流程; 2. 有丰富的NLP项目经验,熟悉Transformer架构及主流大模型,具备实际部署和优化经验者优先; 3. 熟练掌握Python编程语言,熟练使用PyTorch或Tensor…
工作职责
1. 负责医疗垂直领域大模型的基础研究和工程落地,聚焦大模型的预训练、后训练(SFT、RL)等关键技术; 2. 深入挖掘医疗行业的多源异构数据(包括结构化知识、非结构化文本、临床记录等),构建高质量语料库和知识增强机制,支撑大模型在医疗场景下的可控性和泛化性; 3. 研究并实现大模型在医疗领域的继续预训练、推理增强、指令对齐、上下文对话等关键技术,提升模型在复杂医疗任务中的性能与稳定性; 4. 关注并探索大模型前沿技术,持续跟踪LLM、MoE、Scaling Law、Continual Learning等方向,推动医疗大模型能力的持续迭代与升级。
1. 负责医疗行业大模型的研发和应用,深入挖掘垂直行业、开源以及蚂蚁的海量数据,构建行业知识库,研究前沿大模型训练和优化方法,结合医疗行业特性打造可控的医疗大模型。 2. 开发医疗领域领先的技术产品,如泛医疗助手、医护办事等产品,提升医疗行业场景的用户体验和效率,打造支付宝医疗健康新时代下的AI应用。 3. 研究和跟踪前沿技术发展,探索AI助力医疗普惠和智能化的新范式。
1. 数据处理与治理:负责医疗场景下的多模态数据(如医学影像、视频、语音、病历等)的清洗、标准化、标注与增强,构建高质量、符合业务需求的专项数据集; 2. OCR技术开发与应用:主导并优化OCR技术,针对医疗文档、报告、表格等复杂版式,实现高精度的文本检测、识别与关键信息的结构化提取; 3. 大模型微调与强化:针对具体场景,完成领域大模型的指令微调与强化,优化模型对医疗数据的理解、推理与处理能力; 4. 可信AI与评估体系构建:结合知识图谱和询证原则构建模型能力对齐与评估体系,确保模型输出的准确性、安全性与逻辑一致性,推动模型迭代; 5. 技术前瞻与创新:跟踪多模态大模型前沿进展,探索其在医疗健康领域的创新应用场景,并推进技术原型验证与落地。
1. 负责医疗多模态大模型的研发和应用,深入挖掘垂直医疗行业、开源以及蚂蚁的海量数据,研究前沿大模型训练和优化方法,结合医疗行业特性构建图文/语音/视频交互的医疗多模态大模型。 2. 开发医疗领域领先的技术产品,如报告解读、皮肤、影像识别等产品,提升医疗行业场景的用户体验和效率,打造支付宝医疗健康新时代下的AI应用。 3. 研究和跟踪前沿技术发展,探索AI助力医疗普惠和智能化的新范式。
我们正在构建世界级医疗垂直大模型,致力于通过AGI技术革新健康咨询与辅助诊疗场景,让精准医疗普惠每个家庭。如果你渴望在万卡算力集群上实现算法突破,用技术改变14亿人的生命质量,这是你不可错过的技术圣战。加入我们,定义医疗大模型的未来。 职位描述: 1、解决模型在真实、复杂、强噪声的医疗多模态数据中,形成可靠的诊疗推理能力。训练模型能力做到在多模态证据(非结构化文本、影像、时序数据)之间建立可推理的联系,在信息不充分时保持克制,在必要时给出可回溯、可解释的诊疗路径 2、探索多模态模型在医疗问答、智能诊断、多轮对话场景中的能力上限,探索从数据挖掘、RL 训练策略设计、模型调优到效果评估的完整闭环 3、探索神经符号融合系统