logo of horizon

地平线强化学习算法实习生

实习兼职算法序列地点:北京 | 上海 | 香港状态:招聘

任职要求


【任职要求】
1、计算机、数学等相关专业在读硕士及以上学历;
2、具备扎实的数学和机器学习基础;
3、具有较强的编程能力、英文文献阅读能力、自我学习能力;
4、实习时间6个月以上,自我驱动,针对某一个方向独立深入研究,或参与主版本迭代。
【课题背景】
当前自动驾驶技术在复杂场景下的决策能力,仍未达到人类驾驶员的认知与预判水平。核心瓶颈在于系统对物理世界因果规律的理解不足,以及长程…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


【岗位职责】
-突破认知边界:让自动驾驶系统从 “模仿行为” 进化为 “理解世界”,掌握物理因果与长程规划能力。
-革新训练范式:构建自博弈强化学习的全新训练与推理框架,大幅提升系统的安全性、鲁棒性与泛化能力。
-弥合虚实鸿沟:探索仿真与现实世界的无缝迁移,让训练出的策略在真实道路上同样可靠。
包括英文材料
学历+
机器学习+
还有更多 •••
相关职位

logo of netease
实习网易数智

1、理解游戏AI的业务背景和项目需求,参与完成游戏AI的系统设计与开发,支撑业务快速发展。 2、协助实现和优化现有模型/策略/框架,以提高服务性能和效率。 3、协助完成游戏日志处理及分析,构建用户画像体系,为项目推进和决策提供数据支持。

更新于 2025-06-16杭州
logo of netease
实习网易云音乐

我们是网易云音乐算法团队,专注于行业领先的搜索或者推荐算法,我们致力于通过技术赋能云音乐各项业务,通过社区广场推荐,提升用户体验,产生商业化价值。 在这里你可以: 1、参与云音乐各场景相关的AIGC算法应用,使用NLP、多模态、LLM等技术,优化包括多模态内容理解、大模型交互式对话、大模型AI创作生成等业务应用的效果提升; 2、参与云音乐创新业务相关的算法优化,使用业界领先的深度学习、强化学习、图模型等,优化推荐、直播、声音、社交等业务的算法; 3、参与前沿的基础算法模型建设,包括继续预训练、视频生成微调,音乐生成训练等垂类基座模型的构建和应; 4、接触到亿级别海量、真实的用户数据,使用深度学习、强化学习、图模型等算法,发挥推荐的价值; 5、使用行业领先的大规模分布式机器学习平台,例如tensorflow等开源的工具,实现并不断优化推荐、搜索等算法。

更新于 2025-06-30杭州
logo of baidu
实习ACG

1)负责2b方向调度优化算法(深度学习、强化学习)项目的落地; 2)负责前沿算法的探索和研究; 3)构建算法创新体系,主导ICML/NeurIPS等顶会前沿技术的工业化适配 4)设计模型性能监控系统,实现算法效果可量化、可解释、可迭代

更新于 2025-06-17北京
logo of baidu
实习MEG

-负责百度Feed推荐系统核心模块的技术研发工作,大规模机器学习算法在亿级别用户产品中的应用 -负责推荐技术的的持续优化,基于超大规模深度神经网络模型和机器学习系统,探索业界前沿推荐技术 -深入理解推荐生态,通过对数据的敏锐洞察,深入挖掘产品潜在价值和需求,通过技术创新推动生态健康发展 -在个性化推荐场景下,洞察用户需求,将机器学习技术与业务相结合,创造用户与商业价值

更新于 2025-03-28北京