高德地图高德-模型后训练策略产品经理-北京
社招全职5年以上产品类-用户型地点:北京状态:招聘
任职要求
● 算法理解深度: 虽然是产品经理,但必须深刻理解 Transformer 架构,懂 SFT、DPO (Direct Preference Optimization)、PPO 等算法原理; ● 策略产品经…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
● SFT 策略设计: 基于高德的各种场景(打车、自驾、公交),制定 Base Model (尤其是世界模型,当前高德世界模型业内 sota)在垂类领域微调的策略,提升模型在特定指令下的遵循能力; ● RLHF 奖励模型构建: 创造性地将用户的“真实驾驶行为”转化为强化学习的 Reward Signal; ● 对齐与安全: 负责模型在导航建议中的价值观对齐的幻觉问题; ● 世界模型(World Model)探索:探索世界模型在导航场景中的应用落地。
包括英文材料
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
还有更多 •••
相关职位
社招3年以上智能与信息技术
主要职责: 与研发团队紧密合作,完成MindGPT大模型产品的训练策略制定,包括但不限于数据准备、模型微调、强化学习等,确保模型在各应用场景下的性能和效率。 负责大模型基座的评测和对标(包括多模态大模型),指导模型基座的迭代。 跟踪最新的人工智能技术和行业趋势,评估其对产品的影响,并提出相应的产品改进建议。
北京
社招3年以上自动驾驶
完成下一代自动驾驶产品设计和交付,负责模型能力训练、人机交互方案设计、功能体验提升等。 与研发团队紧密合作制定自动驾驶产品的训练策略,包括但不限于数据准备、模型微调、强化学习等,确保模型在各应用场景下的性能和效率。 负责自动驾驶产品的评测和对标,指导自动驾驶能力的提升和迭代。 跟踪最新的人工智能技术和行业趋势,评估其对产品的影响,并提出相应的产品改进建议。
北京
校招软件产品
1.完成下一代自动驾驶产品设计和交付,负责模型能力训练、人机交互方案设计、功能体验提升等; 2.与研发团队紧密合作制定自动驾驶产品的训练策略,包括但不限于数据准备、模型微调、强化学习等,确保模型在各应用场景下的性能和效率; 3.负责自动驾驶产品的评测和对标,指导自动驾驶能力的提升和迭代; 4.跟踪最新的人工智能技术和行业趋势,评估其对产品的影响,并提出相应的产品改进建议。
北京