logo of antgroup

蚂蚁金服蚂蚁集团-大模型算法工程师(强化学习)-杭州【AI Force】

社招全职2年以上技术类-算法地点:杭州状态:招聘

任职要求


1. 计算机、数学或统计学相关专业硕士及以上学历;
2. 2年以上工作经验,半年以上大模型算法相关经验;
3. 具备强化学习算法能力,特别是RLHF经验;
4. 优秀的代码能力、数据结构和基础算法功底…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责构建LLM来提升客服解答准确率,进一步提升客服智能化水平和用户体验。
1. 数据构建、数据合成、指令微调、偏好对齐等;
2. 具备强化学习算法能力,特别是RLHF经验;
3. 跟踪大模型的最新进展,结合业务进行创新,并沉淀为顶会论文。
包括英文材料
学历+
大模型+
算法+
强化学习+
数据结构+
还有更多 •••
相关职位

logo of liauto
校招算法

“理想+”是理想汽车面向全球招募优秀AI技术人才的校园招聘计划,涵盖大模型、AIGC、算法部署、推理加速、AI芯片研发等领域方向。理想汽车2023年实现千亿营收、百亿盈利。经过9年的发展,截至2024年6月理想汽车累计交付已突破80万辆。海量的用户规模和持续的盈利能力将支持理想汽车不断扩大在AI前沿技术领域的研发投入,保持从电动化到智能化的持续领先,把握时代机遇,成为全球领先的人工智能企业。 我们期待你的加入,与理想汽车一起成长、分享收获。通过人工智能技术去改变物理世界的效率和体验,造福我们服务的每一个家庭,以及家庭里的每一位成员。 本岗位的主要工作内容为负责AI算法领域的技术创新研究,包括: 1. 机器视觉相关技术,如图像深度理解; 2. 高效机器学习,如高效的大模型学习技术、多模态融合学习技术; 3. 多模态融合相关技术,如图像和视频的内容理解和生成、三维结构的物体识别等。

杭州
logo of alibaba
社招3年以上

职位描述 1.负责LLM后训练、多模态理解、RL Reasoning、Agent相关基础算法,生成式检索/排序相关算法的研究及开发。 2.将相关算法应用到用户画像建模,商品理解及推荐,复杂Query意图识别及召回等业务场景。

更新于 2025-06-17杭州
logo of eleme
校招淘宝闪购秋季20

我们正在构建一个创新的数据分析诊断模型,旨在通过强化学习(RL)与大语言模型(LLM)技术的结合,为商家提供智能化的店铺运营支持。该模型将帮助商家提高运营效率和服务质量,实现数据驱动的决策优化。 培养方向: 1、参与系统的需求分析、架构设计与开发工作,确保算法模型的高效落地与业务目标的达成。 2、结合大语言模型(LLM)与强化学习(RL)技术,设计并实现智能化的文本生成模型,助力商家运营效率和服务质量的全面提升。 3、持续关注并研究强化学习领域的前沿技术动态,探索新方法与新思路,推动技术创新在实际业务中的落地应用。

更新于 2025-08-05杭州
logo of antgroup
社招3年以上技术类-算法

1.负责以大模型为代表的AI技术能力的建设和优化,打造业界领先的AI技术系统,主要职责包括后训练、大模型训练数据构建、大模型能力评测、大模型推理效果和效率优化、RAG等; 2.参与金融智能相关项目的算法设计与开发,包括但不限于智能理财助理蚂小财、股票、金融供给、金融Copilot、投研及投顾观点生成等; 3.负责金融大模型(如知识注入、对齐等)算法的研究和应用落地; 4.紧密跟踪、探索大模型方向前沿技术,依托丰富且体系化的业务生态,实践大模型算法的创新应用与落地,鼓励并支持将技术研究成果沉淀为论文和专利。

更新于 2025-11-07上海|杭州