蚂蚁金服蚂蚁集团-大模型算法工程师(强化学习)-杭州【AI Force】
任职要求
1. 计算机、数学或统计学相关专业硕士及以上学历; 2. 2年以上工作经验,半年以上大模型算法相关经验; 3. 具备强化学习算法能力,特别是RLHF经验; 4. 优秀的代码能力、数据结构和基础算法功底; 5. 熟练使用Python或者java等编程语言,有pytorch等深度学习框架使用经验; 6. 符合以下条件之一者优先: A)有多轮对话机器人经验; B)有多模态经验; C)CCF-A类论文一作;
工作职责
负责构建LLM来提升客服解答准确率,进一步提升客服智能化水平和用户体验。 1. 数据构建、数据合成、指令微调、偏好对齐等; 2. 具备强化学习算法能力,特别是RLHF经验; 3. 跟踪大模型的最新进展,结合业务进行创新,并沉淀为顶会论文。
“理想+”是理想汽车面向全球招募优秀AI技术人才的校园招聘计划,涵盖大模型、AIGC、算法部署、推理加速、AI芯片研发等领域方向。理想汽车2023年实现千亿营收、百亿盈利。经过9年的发展,截至2024年6月理想汽车累计交付已突破80万辆。海量的用户规模和持续的盈利能力将支持理想汽车不断扩大在AI前沿技术领域的研发投入,保持从电动化到智能化的持续领先,把握时代机遇,成为全球领先的人工智能企业。 我们期待你的加入,与理想汽车一起成长、分享收获。通过人工智能技术去改变物理世界的效率和体验,造福我们服务的每一个家庭,以及家庭里的每一位成员。 本岗位的主要工作内容为负责AI算法领域的技术创新研究,包括: 1. 机器视觉相关技术,如图像深度理解; 2. 高效机器学习,如高效的大模型学习技术、多模态融合学习技术; 3. 多模态融合相关技术,如图像和视频的内容理解和生成、三维结构的物体识别等。
职位描述 1.负责LLM后训练、多模态理解、RL Reasoning、Agent相关基础算法,生成式检索/排序相关算法的研究及开发。 2.将相关算法应用到用户画像建模,商品理解及推荐,复杂Query意图识别及召回等业务场景。
我们正在构建一个创新的数据分析诊断模型,旨在通过强化学习(RL)与大语言模型(LLM)技术的结合,为商家提供智能化的店铺运营支持。该模型将帮助商家提高运营效率和服务质量,实现数据驱动的决策优化。 培养方向: 1、参与系统的需求分析、架构设计与开发工作,确保算法模型的高效落地与业务目标的达成。 2、结合大语言模型(LLM)与强化学习(RL)技术,设计并实现智能化的文本生成模型,助力商家运营效率和服务质量的全面提升。 3、持续关注并研究强化学习领域的前沿技术动态,探索新方法与新思路,推动技术创新在实际业务中的落地应用。