高德地图高德-强化学习算法专家/高级算法工程师-视觉团队
任职要求
● 计算机、电子信息、数学等相关专业,硕士及以上学历,3年以上工作经验。 ● 精通强化学习核心算法,如PPO(Proximal Policy Optimization)、DDPG(Deep Deterministic Policy Gradient)、A3C 等,熟悉VLA等领域RL算法实践。 ● 熟悉仿真环境下的RL训练,比如Isaa…
工作职责
参与空间智能项目,通过深度强化学习技术,建设下一代导航技术。
设计并实现复杂动态场景下的智能体实时运动规划与控制算法,跟踪强化学习、大模型与规划控制结合的前沿方向,提升智能体在未知开放环境中的鲁棒性和适应性。
我们是阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。 岗位描述: 1、参与并负责搜索、推荐算法研发,提升全球不同语言的搜索精准性和国家差异化个性化推荐体验。 2、参与并负责广告算法研发,提升全域流量广告流量变现效率,通过竞价及投放优化、素材生成等提升商家投放效率。 3、参与并负责用增算法的研发,提升电商获客效率,建设优化个性化外投广告、个性化触达消息、个性化权益补贴等算法能力。 4、参与研发生成式AI技术,推动生成式AI在国际电商领域的创新应用。
1. 具身智能大模型研究与优化 (1) 研究和构建具身智能大模型(Embodied Foundation Models)与机器人大脑。 (2) 探索语言、视觉、动作等多模态融合机制(VLM / VLA / VLA-Agent)。 (3) 优化模型的长时记忆、推理能力与可泛化性。 2. 机器人智能算法研发 (1) 设计和实现机器人多模态感知、导航、操作、交互等核心算法模块。 (2) 推进大模型驱动的机器人任务规划与决策。 (3) 基于模拟器与真实世界数据,进行大规模对齐与强化学习(Sim2Real, RLHF, Imitation Learning)。 3. 系统落地与协同研发 (1) 与硬件与系统团队协作,推动模型算法在真实机器人平台上的部署与性能调优。 (2) 支撑具身智能大模型的云端训练体系、数据闭环与MLOps工程。 (3) 发表高水平论文或申请相关专利,推动业界与学界前沿研究。