logo of amap

高德地图高德-强化学习算法专家/高级算法工程师-视觉团队

社招全职3年以上技术类-算法地点:北京状态:招聘

任职要求


● 计算机、电子信息、数学等相关专业,硕士及以上学历,3年以上工作经验。
● 精通强化学习核心算法,如PPO(Proximal Policy Optimization)、DDPG(Deep Deterministic Policy Gradient)、A3C 等,熟悉VLA等领域RL算法实践。
● 熟悉仿真环境下的RL训练,比如Isaa…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


参与空间智能项目,通过深度强化学习技术,建设下一代导航技术。
包括英文材料
学历+
强化学习+
算法+
C+++
还有更多 •••
相关职位

logo of amap
社招5年以上技术类-算法

设计并实现复杂动态场景下的智能体实时运动规划与控制算法,跟踪强化学习、大模型与规划控制结合的前沿方向,提升智能体在未知开放环境中的鲁棒性和适应性。

更新于 2025-09-04北京
logo of alibaba
社招2年以上技术类-算法

我们是阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台的搜索、推荐、广告、用增等技术。团队致力于将最前沿的AI技术与国际化电商业务问题深度结合,为用户打造更好更智能化的网上购物体验,同时赋能百万商家实现更高效的经营。 选择加入我们意味着投身入于高速发展的国际化电商业务,一起打造最先进的AI技术以驱动全球电商业务发展。 岗位描述: 1、参与并负责搜索、推荐算法研发,提升全球不同语言的搜索精准性和国家差异化个性化推荐体验。 2、参与并负责广告算法研发,提升全域流量广告流量变现效率,通过竞价及投放优化、素材生成等提升商家投放效率。 3、参与并负责用增算法的研发,提升电商获客效率,建设优化个性化外投广告、个性化触达消息、个性化权益补贴等算法能力。 4、参与研发生成式AI技术,推动生成式AI在国际电商领域的创新应用。

更新于 2025-08-11北京|杭州|广州
logo of tongyi
社招3年以上技术类-算法

1. 具身智能大模型研究与优化 (1) 研究和构建具身智能大模型(Embodied Foundation Models)与机器人大脑。 (2) 探索语言、视觉、动作等多模态融合机制(VLM / VLA / VLA-Agent)。 (3) 优化模型的长时记忆、推理能力与可泛化性。 2. 机器人智能算法研发 (1) 设计和实现机器人多模态感知、导航、操作、交互等核心算法模块。 (2) 推进大模型驱动的机器人任务规划与决策。 (3) 基于模拟器与真实世界数据,进行大规模对齐与强化学习(Sim2Real, RLHF, Imitation Learning)。 3. 系统落地与协同研发 (1) 与硬件与系统团队协作,推动模型算法在真实机器人平台上的部署与性能调优。 (2) 支撑具身智能大模型的云端训练体系、数据闭环与MLOps工程。 (3) 发表高水平论文或申请相关专利,推动业界与学界前沿研究。

更新于 2025-12-02北京|杭州
logo of quark
社招2年以上技术类-算法

1. 负责召回、排序等相关模块,包括但不限于索引构建、向量召回、召回打分、粗排、精排、重排等工作,洞察业务需求,为用户提升更好的搜索体验 2. 负责大语言模型和多模态大模型相关研发。追踪前沿技术热点,开展预训练、sft、强化学习,并应用到搜索业务、推荐业务、AI产品中 3. 负责应用NLP/CV/多模态等相关技术,理解用户生产的内容,技术方向包括但不限于: 图文和视频等内容类型的打标分类、内容质量打标、热点发现、评论分析等;

更新于 2025-08-18北京