logo of amap

高德地图高德-模型后训练策略产品经理-北京

社招全职5年以上产品类-用户型地点:北京状态:招聘

任职要求


算法理解深度: 虽然是产品经理,但必须深刻理解 Transformer 架构,懂 SFT、DPO (Direct Preference Optimization)、PPO 等算法原理;
● 策略产品经…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


● SFT 策略设计: 基于高德的各种场景(打车、自驾、公交),制定 Base Model (尤其是世界模型,当前高德世界模型业内 sota)在垂类领域微调的策略,提升模型在特定指令下的遵循能力;
● RLHF 奖励模型构建: 创造性地将用户的“真实驾驶行为”转化为强化学习的 Reward Signal;
● 对齐与安全: 负责模型在导航建议中的价值观对齐的幻觉问题;
● 世界模型(World Model)探索:探索世界模型在导航场景中的应用落地。
包括英文材料
算法+
还有更多 •••
相关职位

logo of liauto
社招3年以上智能与信息技术

主要职责: 与研发团队紧密合作,完成MindGPT大模型产品的训练策略制定,包括但不限于数据准备、模型微调、强化学习等,确保模型在各应用场景下的性能和效率。 负责大模型基座的评测和对标(包括多模态大模型),指导模型基座的迭代。 跟踪最新的人工智能技术和行业趋势,评估其对产品的影响,并提出相应的产品改进建议。

北京
logo of liauto
社招3年以上自动驾驶

完成下一代自动驾驶产品设计和交付,负责模型能力训练、人机交互方案设计、功能体验提升等。 与研发团队紧密合作制定自动驾驶产品的训练策略,包括但不限于数据准备、模型微调、强化学习等,确保模型在各应用场景下的性能和效率。 负责自动驾驶产品的评测和对标,指导自动驾驶能力的提升和迭代。 跟踪最新的人工智能技术和行业趋势,评估其对产品的影响,并提出相应的产品改进建议。

北京
logo of liauto
校招软件产品

1.完成下一代自动驾驶产品设计和交付,负责模型能力训练、人机交互方案设计、功能体验提升等; 2.与研发团队紧密合作制定自动驾驶产品的训练策略,包括但不限于数据准备、模型微调、强化学习等,确保模型在各应用场景下的性能和效率; 3.负责自动驾驶产品的评测和对标,指导自动驾驶能力的提升和迭代; 4.跟踪最新的人工智能技术和行业趋势,评估其对产品的影响,并提出相应的产品改进建议。

北京
logo of bytedance
社招A170944A

1、探索LLM+AIGC在字节跳动商业化的规模化应用,围绕线索行业的经营+广告(投前-投中-投后)场景,建设覆盖线索行业全链路的智能对话产品; 2、持续攻坚智能对话体验提升、多轮会话能力、拟人化等前沿领域,提出和落地创新的产品解决方案; 3、了解大语言模型技术和评估方法,建立会话质量和效果的评估体系,并持续跟踪和优化效率; 4、与研发、运营团队紧密协作,协助模型训练质量提升及产品迭代,解决商家使用、覆盖过程中的各类挑战,达成业务目标; 5、对行业动态、前沿研究和新产品保持关注和思考,给出业务落地方向以及产品创新方向的意见。

更新于 2025-04-07北京