logo of antgroup

蚂蚁金服【医疗热招】蚂蚁集团-医疗Agent算法专家-数字医疗

社招全职5年以上技术类-算法地点:杭州状态:招聘

任职要求


1. 精通机器学习大模型相关知识和理论;
2. 熟练掌握 PyTorch,以及 Llama factory、ms-swift、verl 等训练框架;
3. 在 NeurIPSICLRICML 等人工智能顶会发表过论文者优先;
4. 有 Triton、CUDA 编程经验者优先。

工作职责


1. 研发及优化基于问诊和诊断的多轮 LLM;
2. 探索及利用强化学习技术,提升 LLM 的医学推理能力;
3. 探索及研发大模型推理、训练加速技术,提升模型推理、训练效率。
包括英文材料
机器学习+
大模型+
PyTorch+
Llama+
Swift+
NeurIPS+
ICML+
CUDA+
相关职位

logo of antgroup
社招产品类-用户型

1. 洞察行业数据需求,基于整合数据,设计匹配的数据应用方法,为数据给客户带来的业务增益效果负责; 2. 组织协同数据资源、数据分析工具、算法技术相关部门,推动行业领先的数据应用方法产品化落地; 3. 跟进市场前线客户动态,和分析产品使用的效果波动,确保产品能够持续性地为客户带来增益; 4. 梳理行业典型数据应用案例,丰富行业数据应用知识库,推动数据分析能力Agent化。

更新于 2025-06-20
logo of hello
社招技术

研发哈啰出行大模型应用落地,支持千万DAU的Agent(包括主动性交易撮合Agent、生成式搜推广告大模型、智能客服、出行机器人等)

更新于 2025-07-03
logo of quark
社招2年以上技术类-算法

我们正在构建世界级医疗垂直大模型,致力于通过AGI技术革新健康咨询与辅助诊疗场景,让精准医疗普惠每个家庭。如果你渴望在万卡算力集群上实现算法突破,用技术改变14亿人的生命质量,这是你不可错过的技术圣战。加入我们,定义医疗大模型的未来。 1. 负责后训练(Post-training)相关研发工作,提升模型在推理、Planning、RAG、指令跟随、工具调用等方面的能力; 2. 优化和迭代大模型的对齐训练策略,包括 SFT、RLHF、Self-play RL、Agent 优化等; 3. 对齐人类偏好、安全性,提升奖励信号的质量和多样性,解决 Reward Hacking 和奖励融合问题 4. 参与数据飞轮、数据合成、基准集合建设、评测工具的开发与发布等。

更新于 2025-09-08
logo of aliyun
社招3年以上云智能集团

【部门介绍】 阿里云智能大数据和智能实验室致力于成为通义大模型与行业的桥梁,积极推动AI大模型时代各行业的智能化升级。团队主要负责行业语言大模型、多模态大模型以及大模型基础研究,主要技术成果已成功应用到智慧交通、城市治理、生物医疗、大型国际赛事(亚运会和奥运会)等多个行业大模型中。 【工作内容】 1、负责大模型核心技术的研究与开发,深入理解其工作原理,不断探索创新的技术及其应用场景;解决复杂问题的推理能力scaling up,探索Post-training的前沿技术,如Agent RL、test time learning,并参与research intern的指导,沉淀技术成果,提升部门的AI技术的影响力及AI产品的竞争力,以支撑业务的持续增长。 2、对大模型的效果进行持续调优,通过高效的Post-training手段(SFT、RL等)提升LLM领域模型在业务场景下的表现,支撑通义的AI普惠影响力建设和模型规模化调用。

更新于 2025-10-18