logo of meituan

美团视觉生成大模型应用算法

社招全职1年以上核心本地商业-基础研发平台地点:北京 | 上海状态:招聘

任职要求


硕士研究生及以上学历,熟悉的算法和编程能力;
有图像可控生成、编辑、智能成片项目落地经验,不限于商品展示、营销创意、泛娱乐玩法;
有1年以上扩散模型架构的预训练或Post training经验,能快速跟进领域内研究成果并应…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


基于通用大模型,结合创作垂类应用场景,进行领域微调、专项能力增强和偏好学习,提升垂类大模型能力;
构建以智能创作为核心的多模态AI Agent,推动相关的新技术和产品形态落地。
包括英文材料
学历+
算法+
CVPR+
ECCV+
还有更多 •••
相关职位

logo of mi
校招

1. 参与视觉生成与编辑相关的大模型算法研发,探索领域前沿,持续创新,打造有影响力的高水平技术,并解决算法应用遇到的挑战问题,包括主体一致性、语义一致性、画质效果、重点场景效果优化、性能与效果平衡、可控生成等; 2. 探索多模态理解与生成统一的大模型技术。 【课题名称】 视觉生成大模型研究与应用 【课题内容】 研究图像或视频生成与编辑大模型相关技术,优化生成效果及可控性,平衡效率与效果,探索前沿的视觉生成技术方案等。

更新于 2025-06-25武汉
logo of mi
校招

1. 参与视觉生成与编辑相关的大模型算法研发,探索领域前沿,持续创新,打造有影响力的高水平技术,并解决算法应用遇到的挑战问题,包括主体一致性、语义一致性、画质效果、重点场景效果优化、性能与效果平衡、可控生成等 2. 探索多模态理解与生成统一的大模型技术 【课题名称】 视觉生成大模型研究与应用 【课题内容】 研究图像或视频生成与编辑大模型相关技术,优化生成效果及可控性,平衡效率与效果,探索前沿的视觉生成技术方案等。

更新于 2025-06-25武汉
logo of antgroup
社招3年以上技术类-算法

1、面向AGI创新产品,探索视觉内容生成和多模态互动。通过生成算法、计算机视觉、XR等多领域交叉,为用户打造全新的内容体验和交互模式; 2、负责基于开源或内部基模,进行文生图、文生视频、图像/视频编辑等AIGC技术能力的精调、优化,解决可控、互动、编辑等关键问题; 3、追踪领域前沿工作,包括但不限于Diffusion/AR generation model的架构演进、探索RLHF在视觉生成领域的scaling law等。

更新于 2025-11-28北京|杭州
logo of bytedance
校招A216895A

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责多模态大模型的研发和应用,探索超大规模模型,进行极致系统优化;研究相关技术在豆包、智能助手、智能硬件等领域的全新应用和解决方案,包括而不限于多模态理解生成,视觉Agent等能力; 2、数据建设、指令微调、偏好对齐、模型优化; 3、相关应用落地,包括看图对话、问答、搜索、生成创作、逻辑推理、代码生成等; 4、在未来生活中的更多使用场景的深入研究和探索,研发以人工智能技术为核心的新技术、新产品;满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式。

更新于 2025-04-18深圳