logo of antgroup

蚂蚁金服蚂蚁集团-大模型算法工程师(强化学习)-杭州【AI Force】

社招全职2年以上技术类-算法地点:杭州状态:招聘

任职要求


1. 计算机、数学或统计学相关专业硕士及以上学历;
2. 2年以上工作经验,半年以上大模型算法相关经验;
3. 具备强化学习算法能力,特别是RLHF经验;
4. 优秀的代码能力、数据结构和基础算法功底;
5. 熟练使用Python或者java等编程语言,有pytorch深度学习框架使用经验;
6. 符合以下条件之一者优先:
A)有多轮对话机器人经验;
B)有多模态经验;
C)CCF-A类论文一作;

工作职责


负责构建LLM来提升客服解答准确率,进一步提升客服智能化水平和用户体验。
1. 数据构建、数据合成、指令微调、偏好对齐等;
2. 具备强化学习算法能力,特别是RLHF经验;
3. 跟踪大模型的最新进展,结合业务进行创新,并沉淀为顶会论文。
包括英文材料
学历+
大模型+
算法+
强化学习+
数据结构+
Python+
Java+
PyTorch+
深度学习+
C+
相关职位

logo of liauto
校招算法

“理想+”是理想汽车面向全球招募优秀AI技术人才的校园招聘计划,涵盖大模型、AIGC、算法部署、推理加速、AI芯片研发等领域方向。理想汽车2023年实现千亿营收、百亿盈利。经过9年的发展,截至2024年6月理想汽车累计交付已突破80万辆。海量的用户规模和持续的盈利能力将支持理想汽车不断扩大在AI前沿技术领域的研发投入,保持从电动化到智能化的持续领先,把握时代机遇,成为全球领先的人工智能企业。 我们期待你的加入,与理想汽车一起成长、分享收获。通过人工智能技术去改变物理世界的效率和体验,造福我们服务的每一个家庭,以及家庭里的每一位成员。 本岗位的主要工作内容为负责AI算法领域的技术创新研究,包括: 1. 机器视觉相关技术,如图像深度理解; 2. 高效机器学习,如高效的大模型学习技术、多模态融合学习技术; 3. 多模态融合相关技术,如图像和视频的内容理解和生成、三维结构的物体识别等。

logo of alibaba
社招3年以上

职位描述 1.负责LLM后训练、多模态理解、RL Reasoning、Agent相关基础算法,生成式检索/排序相关算法的研究及开发。 2.将相关算法应用到用户画像建模,商品理解及推荐,复杂Query意图识别及召回等业务场景。

更新于 2025-06-17
logo of eleme
校招饿了么秋季202

我们正在构建一个创新的数据分析诊断模型,旨在通过强化学习(RL)与大语言模型(LLM)技术的结合,为商家提供智能化的店铺运营支持。该模型将帮助商家提高运营效率和服务质量,实现数据驱动的决策优化。 培养方向: 1、参与系统的需求分析、架构设计与开发工作,确保算法模型的高效落地与业务目标的达成。 2、结合大语言模型(LLM)与强化学习(RL)技术,设计并实现智能化的文本生成模型,助力商家运营效率和服务质量的全面提升。 3、持续关注并研究强化学习领域的前沿技术动态,探索新方法与新思路,推动技术创新在实际业务中的落地应用。

更新于 2025-08-05
logo of antgroup
社招3年以上技术类-算法

1、参与构建蚂蚁百灵系列大模型,包括但不限于百灵后训练、强化学习系统的算法框架、语料合成、训推优化、模型调优等; 2、参与大语言模型后训练及专项能力优化,提升模型的数学推理、代码生成、超长上下文精细化理解、行动力(Multi-turn& Multi-step Function Calling) 等核心能力; 3、参与高效大语言模型架构优化,设计新颖Sparse Attention、Linear Attention等,提升大模型训练与推理效率。

更新于 2025-08-28