logo of mi

小米顶尖应届-视觉生成大模型算法研究员-大模型

校招全职地点:武汉状态:招聘

任职要求


1. 计算机、人工智能、机器学习、电子信息、自动化、应用数学等相关方向博士学历,视觉生成与编辑大模型相关方向;
2. 熟练掌握PyTorchTensorFlow等至少一种常用深度学习框架,熟练掌pythonC++等至少一门编程语言,优秀的算法代码开发能力;
3. 扎实的视觉生成大模型算法基础,深度参与过该领域的算法研究或应…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 参与视觉生成与编辑相关的大模型算法研发,探索领域前沿,持续创新,打造有影响力的高水平技术,并解决算法应用遇到的挑战问题,包括主体一致性、语义一致性、画质效果、重点场景效果优化、性能与效果平衡、可控生成等
2. 探索多模态理解与生成统一的大模型技术

【课题名称】
视觉生成大模型研究与应用
【课题内容】
研究图像或视频生成与编辑大模型相关技术,优化生成效果及可控性,平衡效率与效果,探索前沿的视觉生成技术方案等。
包括英文材料
机器学习+
学历+
大模型+
PyTorch+
TensorFlow+
深度学习+
Python+
还有更多 •••
相关职位

logo of mi
校招

1、围绕视觉-语言-动作 (VLA) 模型与具身世界模型方向,研发面向机器人感知、理解、预测、决策与动作生成的一体化算法,推动多模态端到端模型在复杂场景中的能力上限。 2、具身大模型全生命周期研发,包括模型架构设计、预训练、后训练、评测与部署,持续优化模型在真实任务中的成功率、鲁棒性与泛化能力。 3、主导或参与视觉/动作编码器、多模态表征学习、离散/连续tokenizer等核心模块研发,提升模型对视觉、动作、时空信息的压缩、建模与生成能力。 4、与数据、Infra等团队,推动数据-训练-测评的协同迭代。 5、跟踪具身智能、多模态大模型、生成式建模等前沿方向,复现并创新相关方法,推动高水平论文、开源项目及专利产出。

更新于 2026-04-03北京
logo of mi
校招

1. 画质光影色彩联调方案设计、研发与实现,包括模型架构设计、专家数据集构建、模型场景/模式适应问题解决,模型可调问题解决; 2. 图像“光”“色”的解耦和联动映射算法研发,探索光属性维度和色属性维度联动规则,并将光色联动规则和AI算法相结合; 3. 三维光场隐式表达与光色增强研发,通过神经网络建模真实世界物理光场信息,和Tone mapping方案结合,提升画质真实感和自然度; 4. 相关领域学术进展跟进,学术研究,产出具备行业影响力的学术科研成果。 【课题名称】 光色联调影调增强方案研发 【课题内容】 1. 画质光影色彩共生规则建模,研究图像“光”“色”的解耦算法,探索光属性维度和色属性维度联动规则; 2. 画质光色联调基础模型研发,基于“光”“色”解耦及联动规则,通过AI模型提升画质质感和自然度; 3. 三维光场隐式表达研发,建模真实世界物理光场信息,通过设计神经网络架构,将多曝光信息转化为神经网络隐式表示的三维结构、光照、材质等信息; 4. 三维光场指导的光色增强,将神经网络隐式表达的三维光场信息,指导光色增强,符合真实世界物理规律。

更新于 2025-11-14北京
logo of mi
校招

1. 参与视觉生成与编辑相关的大模型算法研发,探索领域前沿,持续创新,打造有影响力的高水平技术,并解决算法应用遇到的挑战问题,包括主体一致性、语义一致性、画质效果、重点场景效果优化、性能与效果平衡、可控生成等; 2. 探索多模态理解与生成统一的大模型技术。 【课题名称】 视觉生成大模型研究与应用 【课题内容】 研究图像或视频生成与编辑大模型相关技术,优化生成效果及可控性,平衡效率与效果,探索前沿的视觉生成技术方案等。

更新于 2025-06-25武汉
logo of mi
校招

1. 利用大模型技术支持小爱在各端设备上的Agent跨语言的理解能力; 2. 设计具备长短期记忆能力的智能体架构,运用模型微调、知识编辑、在线学习等技术,使大模型具备记忆的原生能力; 3. 基于SFT、强化学习等后训练方法,指导模型学习正确的“知识检索 - 整合 - 输出”范式,强化大模型对检索结果的筛选、验证与融合能力; 4. 构建覆盖模型准确性(F1值/AUC-ROC)、效率(推理速度/内存占用)、鲁棒性(噪声数据容错)、可解释性(梯度可视化)等多维指标的综合评估体系,构建自动化评估流程和算法。 【课题名称】 认知-记忆-问答链路及自动评估体系研究 【课题内容】 1. 统一地解决Agent对多种语言的理解、以及方言的理解问题 2. 研究智能体对长短期记忆的建模方法,运用模型微调、知识编辑、在线学习、RAG等技术优化大模型的长短期记忆能力,提升智能体的个性化水平 3. 本课题旨在构建集成网络检索知识与大模型生成能力的跨终端智能问答对话系统。通过融合实时网络检索知识,动态扩充模型知识储备,降低模型幻觉风险,提升回答的可信度与时效性。 4. 该课题旨在构建覆盖数据准备、多维度指标评估、自动化工具集成、智能诊断与反馈优化的全链路体系,实现大模型生成效果的闭环评估与问题溯源

更新于 2025-06-25北京