logo of vivo

vivoAI软件架构技术专家(大模型与强化学习)

社招全职5年以上研发类地点:上海 | 杭州 | 深圳状态:招聘

任职要求


1、计算机科学、数学等相关专业,博士优先,在顶级学术会议发表论文者优先考虑;
2、精通深度学习框架,深入研究大模型强化学习算法,深刻理解AIOS系统底层逻辑;
3、5年及以上深度学习强化学习工作经验,主导过AI agent开发及大模型融合项目;
4、具备良好的数学基础,能够优化复杂算法,具备创新和学习能力,能够推动技术实现跨越式发展;
5、沟通协作能力卓越,能够与不同团队紧密合作,引领AIOS和AI agent项目技术方向。

工作职责


1、设计并优化大模型与强化学习融合算法架构,提升模型性能,使其适配AIOS运行环境,增强AI agent决策执行能力;
2、深度融合强化学习与大模型训练,促使AI agent在AIOS生态中自主学习并执行优化策略;
3、主导模型训练,运用分布式计算资源和高效训练策略调优参数,保障模型在AIOS和agent应用中的稳定性;
4、探索多模态融合创新应用,拓展模型能力边界,满足AIOS下AI agent复杂交互需求;
5、及时诊断并解决模型训练和应用过程中出现的问题,确保AI agent稳定运行,参与需求讨论,提供建设性技术建议。
包括英文材料
深度学习+
大模型+
强化学习+
算法+
AI agent+
相关职位

logo of vivo
社招5-10年研发类

1、设计并优化大模型与强化学习融合算法架构,提升模型性能,使其适配AIOS运行环境,增强AI agent决策执行能力; 2、深度融合强化学习与大模型训练,促使AI agent在AIOS生态中自主学习并执行优化策略; 3、主导模型训练,运用分布式计算资源和高效训练策略调优参数,保障模型在AIOS和agent应用中的稳定性; 4、探索多模态融合创新应用,拓展模型能力边界,满足AIOS下AI agent复杂交互需求; 5、及时诊断并解决模型训练和应用过程中出现的问题,确保AI agent稳定运行,参与需求讨论,提供建设性技术建议。

logo of vivo
社招5-10年研发类

1、设计并优化大模型与强化学习融合算法架构,提升模型性能,使其适配AIOS运行环境,增强AI agent决策执行能力; 2、深度融合强化学习与大模型训练,促使AI agent在AIOS生态中自主学习并执行优化策略; 3、主导模型训练,运用分布式计算资源和高效训练策略调优参数,保障模型在AIOS和agent应用中的稳定性; 4、探索多模态融合创新应用,拓展模型能力边界,满足AIOS下AI agent复杂交互需求; 5、及时诊断并解决模型训练和应用过程中出现的问题,确保AI agent稳定运行,参与需求讨论,提供建设性技术建议。

logo of vivo
社招5年以上研发类

1、设计并优化大模型与强化学习融合算法架构,提升模型性能,使其适配AIOS运行环境,增强Al agent决策执行能力。 2、深度融合强化学习与大模型训练,精心设计奖励机制促使AI agent在AIOS生态中自主学习并执行最优策略。 3、主导模型训练工作,充分运用分布式计算资源和高效训练策路,精准调优参数,保障模型在AIOS和agent应用中的稳定性。 4、积极探索多模态融合创新应用,拓展模型能力边界,满足AIOS下Al agent复杂交互需求。 5、及时诊断并解决模型训练和应用过程中出现的问题,确保Al agent稳定运行,参与需求讨论,提供建设性技术建议。

logo of vivo
社招5年以上研发类

1、设计并优化大模型与强化学习融合算法架构,提升模型性能,使其适配AIOS运行环境,增强AI agent决策执行能力; 2、深度融合强化学习与大模型训练,促使AI agent在AIOS生态中自主学习并执行优化策略; 3、主导模型训练,运用分布式计算资源和高效训练策略调优参数,保障模型在AIOS和agent应用中的稳定性; 4、探索多模态融合创新应用,拓展模型能力边界,满足AIOS下AI agent复杂交互需求; 5、及时诊断并解决模型训练和应用过程中出现的问题,确保AI agent稳定运行,参与需求讨论,提供建设性技术建议。