logo of jd

京东大模型算法工程师

社招全职算法开发岗地点:北京状态:招聘

任职要求


1. 学历与专业背景:计算机、人工智能、软件工程、电子工程、自动化、信息工程、模式识别、统计学、应用数学、医学信息学、生物医学工程等相关专业硕博学历;
2. 工程能力:熟练掌握 Python/PyTorch/Transformer/FSDP,熟悉 C++/Rust/Go/Java/Cuda/Triton/TileLang 等高性能编程语言的一种或多种,熟悉 Megatron/Slime/verl/vLLM/SGLang等常用训推框架中的一种或多种;有大规模分布式训练、高性能算子研发、Agentic RL等实战经…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 医疗 AI 大模型 Infra 建设与业务支撑:负责医疗 AI 大模型在 Harness、训练、推理全链路的基础设施建设与能力落地,支撑问诊、诊断辅助、医学知识检索、病历理解、临床决策支持、健康管理等核心医疗场景,推动前沿 AI 能力从研究原型走向稳定、可规模化的业务系统;
2. Agentic Harness 系统建设: 设计并实现面向医疗场景的 Agentic Harness,包括任务环境构建、工具调用框架、轨迹采集、评测体系、数据闭环与自动化迭代机制;重点探索 Agentic Search、Code React、Self-Evolution、多工具协同、多智能体协作、长链路任务执行等方向,提升模型在复杂医疗任务中的自主推理、信息检索、任务分解和问题解决能力;
3. 训练基础设施与 Agentic RL 能力建设:建设面向大模型后训练、Agentic RL 和自进化的训练 Infra,支持 custom rollout、trajectory generation、reward/verifier 设计、偏好数据构建、在线/离线策略优化、自动数据合成与筛选等能力;推动 RLHF、RLAIF、DPO、PPO/GRPO、Self-Play、Self-Evolution 等技术在医疗 AI 场景中的落地;
4. 推理系统与高性能 Serving 优化:负责大模型推理系统的架构设计与性能优化,包括但不限于分布式 KV-Cache、Continuous Batching、Speculative Decoding、Prefill/Decode 分离、模型并行、请求路由、多模型级联、缓存复用、长上下文推理、低延迟高吞吐 Serving 等方向,持续优化医疗业务场景下的推理成本、稳定性和用户体验。
包括英文材料
学历+
模式识别+
Python+
PyTorch+
Transformer+
FSDP+
C+++
Rust+
还有更多 •••
相关职位

logo of pinduoduo
社招技术类

1、负责大模型设计和开发工作,包括模型设计、prompt优化、预训练、模型加速、数据集建设等; 2、结合业务需求,实现电商平台业务场景的智能化、自动化升级。

更新于 2026-04-16上海
logo of jd
社招1年以上算法开发岗

1、参与生成式大模型能力构建;不局限于模型设计、prompt优化、预训练、模型推理加速、其他能力建设等; 2、采用最先进的并行处理和分布式学习技术,制定并执行性能优化策略,显著提升大型语言模型的训练速度和推理能力,例如跟进DeepSeek R1技术架构等,确保技术行业领先; 3、推进大模型技术在京东物流各个业务场景落地,包括不限于智能问答、智能数据分析、智能决策以及Computer Use等,助力业务流程优化,增质提效; 4、深度探索大语言模型方向,保持技术领先优势,推动京东物流在行业内树立高效、精准的大模型/多模态大模型应用标杆,并取得业务收益。

更新于 2025-06-09北京
logo of xiaohongshu
社招大模型

1、探索新一代大语言模型基座架构,完成扩散模型(diffusion model)在大语言模型的重塑,突破逐个token预测的方式,实现高效的推理模式,探索全新scaling law; 2、实现大模型训练的数据清洗、合成和评估;设计和实现大模型训练的AI Infra框架。

更新于 2025-11-20北京|上海
logo of meituan
社招核心本地商业-基

1、负责端到端开发新的 AI 功能,在整个 ML stack 中身兼数职。 2、负责训练新的模型,在效果、规模和推理速度方面迭代到先进的技术水平。 3、设计能够评估模型不同角度的评估方案。 4、负责大模型算法策略的设计、研发和优化,提升系统性能和稳定性

更新于 2025-06-19北京|上海