logo of meituan

美团图像生成基座算法专家

社招全职1年以上核心本地商业-基础研发平台地点:北京 | 上海状态:招聘

任职要求


在视觉生成的基座模型或者可控生成方向上具有丰富的科研或实践经验,需至少1年以上的扩散模型相关研发经历;

精通Diffusion Transformer算法,能够跟进领域内技术研究成果进行快速实验和应用;

熟悉大模型SFT和RHLF相关算法工作,具备应用到视觉生成pipeline的能力;

熟悉深度学习框架PyTorch,对大模…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责文生图基座模型Post-training阶段算法研发,包括但不限于Quality-Tuning、RHLF等算法模块,持续提升基座模型图像生成质量;

基于自研文生图基座模型研发具备长文本可控生成、图像可控编辑能力,推动图像生成在各业务场景的产品化落地;
包括英文材料
Transformer+
算法+
大模型+
还有更多 •••
相关职位

logo of amap
社招4年以上技术类-算法

我们是谁? 作为中国领先的数字地图内容及导航服务提供商,高德地图日均服务数亿用户出行决策,每日处理超百亿级位置数据。视觉技术中心是驱动高德实现厘米级高精地图、实时三维重建、多模态感知等核心技术的引擎,持续突破自动驾驶、AR导航、智慧交通等领域的技术边界。 团队gihub主页:https://github.com/amap-cvlab 为何加入我们? 挑战世界级技术难题,追求智能上限 用AI驱动国民级APP的产品迭代和颠覆式创新 岗位职责: 1、负责研发空间智能核心技术,进行室内/室外/航拍/卫片等全场景高质量空间理解、重建与生成,包括但不限于基于图像、视频、点云、Mesh和3DGS等多种模态数据的空间智能基座与应用; 2、负责多模态大模型和视频生成大模型的预训练、微调等工作,包括但不限于数字人、生成式重建及空间生成等应用方向; 3、负责大规模多模态数据集的构建、清洗与管理,搭建高效数据流水线,保障算法训练与评估; 4、负责结合具体需求,抽象出关键算法进行研发,并持续保持及引领相关技术指标。

更新于 2025-11-14北京
logo of aligenie
社招3年以上技术类-算法

1. 多模态理解:负责图文/视频/音频理解相关的算法研发,提升模型对复杂多模态场景的语义分析和推理能力。 2. 多模态生成:开发基于 Diffusion Model 或 Autoregressive 架构的生成算法(如 Text-to-Image, Text-to-Video),优化生成的质量、多样性与可控性。 3. 统一架构:设计并研发多模态大模型理解和生成的统一架构,通过高效Transformer结构、位置编码优化等,实现对图像、视频、文本的深度语义理解与高保真内容生成。

更新于 2026-04-08北京|杭州
logo of amap
社招2年以上技术类-算法

我们是高德视觉技术中心,驱动高德实现高精度地图、三维重建、LLM/VLM,AI Agent等核心技术,持续突破自动驾驶、AR导航、具身智能、推广搜和生活服务等领域的技术边界。我们团队致力于利用三维重建、生成式世界模型、多模态大模型等技术打通虚拟与现实,探索空间智能技术路线,让算法在真实应用中产生即时经济价值与社会影响力。 团队gihub主页:https://github.com/amap-cvlab 岗位职责: 1. 3D动/静态生产:利用三维重建、生成模型、多模态大模型对单图、视频完成动态物体/静态场景重建、生成、编辑,并得到可交互的3D、长时序视频; 2. 世界模型构建:结合具身智能、自动驾驶等数据探索空间智能的统一范式,完成环境感知、智能体预测、决策规划等任务并得到未来状态和未来传感器信息,为强化学习提供基座; 3. 产线落地与性能优化:与具身智能、自动驾驶、智能导航等业务协同,完善仿真数据链路; 4. 跟踪学术界和工业界在生成式AI/世界模型相关领域的最新进展,保持公司在该领域的技术领先地位。

更新于 2025-11-27北京
logo of meituan
社招2年以上无人机业务部

1. 负责研发空间智能核心技术,进行室内/室外/航拍/卫星影像等全场景高质量空间理解、重建与生成,静态与动态场景的仿真,包括但不限于基于图像、视频、点云、Mesh和3DGS等多种模态数据的空间智能基座与应用; 2. 参与并实现端到端多视角三维重建流水线:数据预处理、相机/传感器标定与对齐、稠密重建与渲染模块的设计与开发。 3. 优化算法性能(计算与内存),并参与模型推理加速、量化或裁剪等工程化工作以满足实时/大规模训练需求。

更新于 2026-01-29北京|深圳|上海