logo of liauto

理想汽车智能空间-多模态智能体算法工程师

校招全职算法与软件地点:杭州状态:招聘

任职要求


1. 硕士及以上学历,参与过对话、搜索、推荐、AIGC至少其一领域的核心算法开发工作,关注行业及学界进展;
2. 扎实的算法基础,熟悉自然语言处理、多模态、知识图谱和机器学习技术,对技术探索、开发及应用有热情;
3. 熟悉Python/C++/Java等编程语言,熟悉PyTorchTensorflow深度学习框架并有实际项目经验。

工作职责


1. 负责大语言模型以及多模态大模型的预训练、精调等研发及落地;
2. 负责大模型智能体记忆、规划、工具、RAG能力的研发以及大模型应用的研发。
包括英文材料
学历+
算法+
NLP+
机器学习+
Python+
C+++
Java+
PyTorch+
TensorFlow+
深度学习+
相关职位

logo of liauto
校招算法与软件

1. 负责大语言模型以及多模态大模型的预训练、精调等研发及落地; 2. 负责大模型智能体记忆、规划、工具、RAG能力的研发以及大模型应用的研发。

logo of liauto
校招算法与软件

1. 负责大语言模型以及多模态大模型、精调等研发及落地; 2. 负责大模型智能体及大模型应用的研发。

logo of liauto
校招算法与软件

1. 负责大语言模型以及多模态大模型、精调等研发及落地; 2. 负责大模型智能体及大模型应用的研发。

logo of tongyi
校招通义2026届秋

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 若你对以下一个或者多个方向感兴趣均欢迎投递: 1)多模态基础模型的研发,包括融合视觉语言的跨模态理解模型设计,提升视觉基础模型在图像/视频中的视觉知识、空间感知、Omni Parsing 等核心能力,并同时优化多模态大模型的AI infra。 2)通过强化学习(RL)持续提升多模态模型推理能力和执行任务能力,构建支持网络世界(PC/Mobile/Web/游戏)交互的通用智能体,将相关能力拓展到GUI agent,VLA,以及具身智能场景中。 3)研究理解与生成统一的模型架构,实现跨模态生成与推理的协同优化。 工作职责: 1. 多模态 pre-training:开展研究及进行实验,研究内容包括:数据清洗筛选、数据配比优化、课程学习、视觉语言模型结构设计与优化、训练策略优化、预训练数据合成、scaling law 预测、词表优化、模型蒸馏与压缩、长上下文能力优化等。 2. 多模态 post-training:迭代 post-training 训练策略(SFT/RLHF),专项能力数据迭代,参与模型能力评测及评测数据和评估标准的迭代。 3. 多模态推理和通用 agent:通过强化学习(RL)持续提升多模态模型推理能力和执行任务能力,打造多模态的 test scaling laws,并推动模型对网络和虚拟世界的交互和任务完成能力。 4. 统一理解生成:构建视觉统一理解生成大模型,推进多模态统一生成与理解的推理和交互新范式。

更新于 2025-08-22