蚂蚁金服蚂蚁技术研究院长期研究型实习生-强化学习方向
实习兼职蚂蚁技术研究院长期研究型实习生项目地点:北京 | 上海 | 杭州状态:招聘
任职要求
1.有相关研究背景的博士生,特别优秀的硕士生亦可; 2.有丰富的自然语言处理或强化学习方向的科研经验,基础扎实,对至少其中一个子领域的算法在深度/广度两个维度都有深入的理解和思考; 3.学习能力强,热爱思考问题,有独立的研究风格,工作原创性高; 4.动手能力强,工作效率高,并有独立编写和调…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
职位描述:负责强化学习方向算法的创新研究
包括英文材料
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
还有更多 •••
相关职位
实习蚂蚁技术研究院长
职位描述: 1.用形式化方法对程序语言的内存安全、功能安全性进行验证,特别是Rust语言方向; 2.用形式化方法对安全时序逻辑和功能、协议设计、算法设计的安全属性,进行验证; 3.用形式化方法对较简单的、小规模的AI系统的安全属性,进行验证; 4.探索形式化方法,发表高水平论文或专利,提升蚂蚁集团在该领域的业界影响力; 5.与国内外形式化验证领域的一流研究机构进行交流与合作。
北京|杭州
实习蚂蚁技术研究院长
职位描述: 参与大模型的前沿研究工作。你将与顶尖的研究团队合作,探索数据在大模型训练、优化和应用中的核心作用,推动大模型数据智能领域的创新。 研究内容: 1.研究和实践创新的数据生成策略,为模型打造高质量、高信息量的人类偏好数据集 2.迭代和优化 Critic Model,设计有引导性的评估规则,使其能够对模型输出进行自动化、高质量的打分 3.搭建和维护贯穿训练全过程的持续评估系统,实时监控模型的价值对齐、输出风格及其他关键性能指标,确保模型行为符合预期
北京|上海|杭州