理想汽车基座模型-大模型算法实习生-模型推理方向-北京
实习兼职算法与软件地点:北京状态:招聘
任职要求
必备项: 1. 专业背景:计算机、数学、人工智能等相关专业的在校生,统计和强化学习相关方向优先; 2. 基础能力:理论功底扎实,熟悉LLM、NLP相关算法,精通transformer和RL等相关算法优先; 3. 工作态度:主动积极,自驱能力强,具有创新意识。 加分项:(没有也没关系,我们更看重潜力) 1. 实习时长:能够长期实习,长期合作; 2. 竞赛大佬:ACM/OI大神,代码能力出众; 3. 学术研究:在ML顶会发表论文,研究能力出众; 4. 相关经验:有大模型推理、模型优化、大模型框架优化和强化学习等相关工作经验。
工作职责
职位描述: 1. 研究通用大模型推理规划数据合成; 2. 研究通用智能体强化学习策略; 3. 研究Agent AI算法,实现L3智能; 4. 总结:大模型推理方向,GPU资源丰富! 我们能提供: 1. 技术沉淀:参与大模型技术研究,培养解决技术难题的能力; 2. 实战经验:参与真实业务场景的落地和上线; 3. 论文产出:发表高水平论文,培养顶会写作能力; 4. 成长支持:Mentor指导,重视成长,和优秀的人做有挑战的事。
包括英文材料
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
相关职位
实习算法与软件
1. 负责VLA大模型的端/云基座大模型架构设计与优化、多模态融合训练策略优化; 2. 参与预训练、COT、逻辑推理、数据合成等数据建设与质量提升; 3. 负责模型轻量化能力建设,蒸馏、kvcache压缩、稀疏注意力机制设计与优化; 4. 负责基座大模型核心能力建设,逻辑推理与决策能力、代码能力等。

实习技术族-实习
1. 与研究员合作针对集团的生成式AI业务板块中共性痛点和挑战性问题研发创新性解决方案; 2. 与研究员合作做某一细分领域算法或系统的深入研究,例如但不限于数学和逻辑推理数据合成,推理强化学习等; 3. 与研究员合作维护相关研究方向的基准(如代码、评测集等),将创新算法沉淀为论文、技术报告或专利。
更新于 2025-05-09
实习大模型
1、探索下一代AI搜索范式,从底层模型架构和训练方式角度出发,研发AI搜索大模型,在推理速度,幻觉,回答准确性等方向进行突破; 2、探索新一代大语言模型基座架构,以高效推理模式为核心优化目标,探索全新模型结构和scaling law。 3、在工作中能快速成长,积极探索前沿技术,解决好业务中遇到的实际问题,完成数据处理、建模和工程上线,对AI技术始终保持热爱,实习期间可发表论文。
更新于 2025-08-19