
平安科技算法工程师(医疗数据分析方向)
任职要求
1.计算机、人工智能、数学或相关专业硕士及以上学历; 2. 熟练掌握 Python,熟悉 PyTorch 或 TensorFlow,具备扎实的数据结构与算法基础; 3.熟悉 Transformer 架构,了解常见的大模型训练/推理优化技术; 4.极强的…
工作职责
工作内容: 参与平安集团智能理赔系统的研发,利用大语言模型(LLM)、多模态理解与知识图谱技术,构建“从客户材料到赔付决策”的全自动审核引擎。 主要职责: - 参与 AI 理赔审核系统的研发,协助构建多模态文档(医疗影像、保单 PDF)的信息提取,实现对客户提交材料的理解与判别; - 设计并实现保单条款与理赔规则的结构化表示,支持大模型精准调用与推理; - 追踪大模型领域前沿技术,优化大模型提示工程(Prompt Engineering)、微调(Fine-tuning)与RAG(检索增强生成)方案,提升模型在复杂理赔场景下的判断准确率; - 负责理赔案件数据的清洗、标注体系设计及高质量数据集的构建; - 参与系统开发,将AI模型能力集成到理赔流程中,支持高并发、低延迟的生产环境部署; - 编写技术文档、参与代码评审,持续优化系统稳定性与可维护性。

达摩院医疗AI实验室基础技术团队通过研究计算机视觉技术来解决医疗影像AI中的科学和应用难题,团队成员主要来自国内外知名视觉实验室或者医疗影像AI实验室,且曾获得过斯坦福大学全球top2%顶尖科学家,清华大学AMiner AI Top2000等荣誉。近五年团队在CVPR/ICCV/NeurIPS/ICLR/ICML/TPAMI/IJCV等顶会顶刊发表论文超百篇,并曾获CVPR 2022 Best Student Paper奖项。目前,达摩院医疗AI实验室“一扫多筛”产品已经在多家医疗成功落地,多篇相关成果在nature medicine发表。但是,医疗数据相比通用数据获取和标注难度大得多,医疗数据稀缺问题依然是行业未解的难题。为了解决该难题,我们正在研发医疗领域的“SORA”模型,构建医疗影像数据生成的基础生成模型。我们期待该模型能够高度可控合成高质量医学影像数据,从而解决数据稀缺、数据质量良莠不齐、数据标注成本高昂、多中心分布差异、罕见病例难获取、预测病灶演变、影像质量增强等一系列医疗影像数据难题。我们欢迎视觉背景和医疗影像AI背景的英才加入团队,与我们一起将医疗AI推入基础大模型时代。 1. 负责医疗影像生成基础模型及其下游影像合成应用算法研发,包括但不限于基础模型训练、生成模型post-training算法、病灶合成算法、影像增强算法、罕见病影响合成算法、生成算法训练推理优化、生成理解一体化等。 2. 负责医疗影像数据的分析和处理,通过分析影像本身和对应的影像报告挖掘其中高质量的信息,为生成算法提供数据基础。 3. 推动算法落地,与医院和医生保持沟通合作,分析应用场景中的算法问题,能够根据具体问题选择并设计合适的模型和技术方案。 4. 持续视觉和医疗影像AI前沿技术与发展热点,产出高水平论文,建立行业影响力。

整体岗位描述:负责结合自然语言处理(NLP)和计算机视觉(CV)技术,开展微表情分析、心理疾病诊疗、欺诈识别等模型研发工作。参与设计和实现多模态大模型,推动技术在情感计算、金融风控、心理健康等领域的应用。 1.负责多模态算法的研究与开发,包括但不限于微表情识别、情绪分析、心理疾病诊疗、金融风控等; 2.结合NLP和CV技术,设计和实现跨模态数据融合算法,如文本与图像的联合建模; 3.与团队协作,推动算法模型在实际场景中的落地应用; 4.关注前沿技术动态,探索多模态技术在心理健康、金融风控领域的创新应用。
1. 负责垂直行业大模型算法能力研发,包括但不限于数据合成、安全对齐、模型后训练等,支持大模型SaaS化服务与本地部署类的商业化产品,满足内外部客户对内容安全、抑制模型幻觉、模型性能提升、智能体安全的需求; 2. 负责AI Agent核心逻辑实现,算法及模型的设计、实验、调优等研发工作; 3. 跟踪AI Agent相关前沿技术,并探索在垂直领域的应用,持续进行技术预研与创新。
1. 医学标注体系构建: 主导问诊对话(不排除医学影像、电子病历等)多模态数据的标注标准制定和执行; 设计疾病标签体系与知识图谱关联规则(如:主诉-症状-诊断-处置的逻辑链路); 建立标注质量三级审核机制(初级标注员→医学专家→交叉验证)。 2. AI模型医学训练: 参与模型需求医学解读,定义诊断场景边界与禁忌症预警规则; 策划训练数据分布策略(如:罕见病案例增强、地域性疾病权重调整); 主导bad case医学归因分析,指导算法团队进行特征工程优化。 3. 临床验证与迭代: 设计双盲对照试验验证AI诊断结果与临床一致性; 监测模型漂移现象,及时启动数据清洗与再训练流程; 输出医学可解释性报告(如:诊断依据溯源、置信度阈值校准)。