logo of jd

京东大模型算法专家

社招全职算法开发岗地点:北京状态:招聘

任职要求


1.有计算机科学、数学、统计学或相关领域的硕士或博士学位;
2. 熟悉Python深度学习框架,具有良好的编程能力和扎实的数学理论基础;
3.熟悉掌握大模型相关技术,有实际主导或参与过大模型训练工作,包括不限于:预训练、SFT、强化对齐等;
4. 关注行业前沿进展,对技术开发及应用有热情,有自己的想法并乐于挑战自我;
5. 良好的沟通能力,跨团队协作能力,具备出色的规划、执行力,强烈的责任感,以及优秀的学习能力和自我驱动力。

加分项:
1. 有相关领域的开源项目、竞赛获奖、顶会论文发表/在投;
2. 熟悉DeepSpeed、Megatron-LM  、VeRL 、UnslothLLM开源工具,具备大模型训练推理框架的优化以及开发能力。
3.熟悉大模型应用框架如Langchain等,工程能力较强;

符合京东价值观:客户为先、创新、拼搏、担当、感恩、诚信。

工作职责


1.负责京东信息安全大模型的应用研发工作,涵盖模型的持续预训练与优化、监督微调(SFT)以及强化学习等关键环节;
2.深入调研并积极探索大模型领域的前沿技术,包括先进的预训练方法、创新的 post-training 技术以及大模型强化学习技术;
3.参与大模型服务的部署实施,着力于模型量化处理和推理过程的加速优化,提升模型应用的性能和效率;
4.参与大模型在agent应用算法优化工作,提升agent任务执行效果;
包括英文材料
学历+
Python+
深度学习+
大模型+
SFT+
Unsloth+
LangChain+
相关职位

logo of meituan
社招核心本地商业-基

1. 从flops efficiency角度,对大模型预训练过程进行分析与探索,包括不限于对scaling law的研究,数据的认知实验,MoE等模型架构设计,以及其他工程与算法结合的ml sys相关优化等。 2. 负责原生多模态大模型的构建与预训练,包括各模态分词器设计,合成数据策略,以及跨模态融合训练策略等,提升原生多模态模型在视觉/语音的理解与生成任务上的能力。 3. 进行大模型reasoning能力的相关研究,研究pre-train / test-time compute对于模型推理能力的影响,借助SFT / DPO / self-play等手段,提高模型在代码数学等推理任务上的表现。 4. 通过post-training激发模型在各下游任务上的能力,从而构建具有通用问题解决能力的agent。

更新于 2025-06-03
logo of hello
社招技术

研发哈啰出行大模型应用落地,支持千万DAU的Agent(包括主动性交易撮合Agent、生成式搜推广告大模型、智能客服、出行机器人等)

更新于 2025-07-03
logo of honor
社招研发类

1、跟进大模型领域最新进展,包括LLM、VLM、SpeechLLM、Reasoning模型等领域近期算法的跟踪、实现、最佳实践流程标准化; 2、与研发团队密切合作,面向实际业务场景与软硬件特点,将算法与工程技术落地于实际项目,满足前沿创新目标或者业务目标。

更新于 2025-04-28
logo of sf
社招3-5年

1. 负责制定大语言模型方向的技术战略与演进路线,持续引领团队在算法创新、系统部署、智能体架构等关键方向取得突破; 2. 全面统筹垂域大语言模型的研发、评估与部署生命周期,推动算法与系统能力的标准化、模块化和可复用建设; 3. 牵头在客服、销售、收派、运营、办公智能等核心领域构建智能体系统,重构关键业务流程,推动大语言模型的深度融合与落地应用; 4. 主导复杂业务问题的抽象建模,构建行业级、多任务、多场景的评估体系,覆盖模型精度、稳定性、安全合规等维度; 5. 制定并实施大语言模型系统性能优化策略,构建资源利用率高、弹性强的推理服务架构,提升模型部署效率与稳定性; 6. 引导团队围绕业务目标开展系统性大语言模型算法调研与分析,识别潜在问题与机会点,提出可落地的优化方案; 7. 紧跟大语言模型领域技术发展,持续输出行业趋势洞察,制定面向未来的技术路线与实施规划; 8. 管理算法团队,对团队成员进行技术引领、指导、职业发展辅导,保持团队先进性。

更新于 2025-08-15