蚂蚁金服蚂蚁集团-大模型算法工程师（强化学习）-杭州【AI Force】

社招全职2年以上技术类-算法2025-08-27地点：杭州状态：招聘

扫码手机上打开

任职要求

1. 计算机、数学或统计学相关专业硕士及以上学历；
2. 2年以上工作经验，半年以上大模型算法相关经验；
3. 具备强化学习算法能力，特别是RLHF经验；
4. 优秀的代码能力、数据结构和基础算法功底…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

负责构建LLM来提升客服解答准确率，进一步提升客服智能化水平和用户体验。
1. 数据构建、数据合成、指令微调、偏好对齐等；
2. 具备强化学习算法能力，特别是RLHF经验；
3. 跟踪大模型的最新进展，结合业务进行创新，并沉淀为顶会论文。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

大模型+

算法+

强化学习+

数据结构+

还有更多 •••

登录查看完整学习资料

相关职位

【理想+】AI算法工程师-视觉感知/强化学习-杭州

校招算法

“理想+”是理想汽车面向全球招募优秀AI技术人才的校园招聘计划，涵盖大模型、AIGC、算法部署、推理加速、AI芯片研发等领域方向。理想汽车2023年实现千亿营收、百亿盈利。经过9年的发展，截至2024年6月理想汽车累计交付已突破80万辆。海量的用户规模和持续的盈利能力将支持理想汽车不断扩大在AI前沿技术领域的研发投入，保持从电动化到智能化的持续领先，把握时代机遇，成为全球领先的人工智能企业。我们期待你的加入，与理想汽车一起成长、分享收获。通过人工智能技术去改变物理世界的效率和体验，造福我们服务的每一个家庭，以及家庭里的每一位成员。本岗位的主要工作内容为负责AI算法领域的技术创新研究，包括： 1. 机器视觉相关技术，如图像深度理解； 2. 高效机器学习，如高效的大模型学习技术、多模态融合学习技术； 3. 多模态融合相关技术，如图像和视频的内容理解和生成、三维结构的物体识别等。

杭州

淘天算法技术-大模型算法工程师（AI导购）-杭州/北京

社招3年以上

职位描述 1.负责LLM后训练、多模态理解、RL Reasoning、Agent相关基础算法，生成式检索/排序相关算法的研究及开发。 2.将相关算法应用到用户画像建模，商品理解及推荐，复杂Query意图识别及召回等业务场景。

更新于 2025-06-17杭州

算法工程师-强化学习

校招淘宝闪购秋季20

我们正在构建一个创新的数据分析诊断模型，旨在通过强化学习（RL）与大语言模型（LLM）技术的结合，为商家提供智能化的店铺运营支持。该模型将帮助商家提高运营效率和服务质量，实现数据驱动的决策优化。培养方向： 1、参与系统的需求分析、架构设计与开发工作，确保算法模型的高效落地与业务目标的达成。 2、结合大语言模型（LLM）与强化学习（RL）技术，设计并实现智能化的文本生成模型，助力商家运营效率和服务质量的全面提升。 3、持续关注并研究强化学习领域的前沿技术动态，探索新方法与新思路，推动技术创新在实际业务中的落地应用。

更新于 2025-12-05杭州

蚂蚁集团-大模型算法工程师（股票&金融专业分析）-蚂小财

社招3年以上技术类-算法

1.负责以大模型为代表的AI技术能力的建设和优化，打造业界领先的AI技术系统，主要职责包括后训练、大模型训练数据构建、大模型能力评测、大模型推理效果和效率优化、RAG等； 2.参与金融智能相关项目的算法设计与开发，包括但不限于智能理财助理蚂小财、股票、金融供给、金融Copilot、投研及投顾观点生成等； 3.负责金融大模型（如知识注入、对齐等）算法的研究和应用落地； 4.紧密跟踪、探索大模型方向前沿技术，依托丰富且体系化的业务生态，实践大模型算法的创新应用与落地，鼓励并支持将技术研究成果沉淀为论文和专利。

更新于 2025-11-07上海|杭州