logo of xiaohongshu

小红书多模态算法工程师AIGC方向-图像生成/编辑

社招全职大模型地点:北京 | 上海状态:招聘

任职要求


1. 计算机、数学、自动化、控制等相关专业;
2. 扎实的数学和算法基础:概率统计、数值优化等算法;
3. 扎实的编程基础:熟悉PytorchTensorFlow、MXNet等其中的一种或以上;
4. 了解前沿的Diffusion、LLM、VLLM算法,包括不限于StableDiffusion、Flux、Llama
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责文生图(Text-to-Image)生成算法的研发与优化,包括中文场景下图像生成质量提升、多模态对齐、可控性生成等方向;
2. 图文融合的排版生成技术研发,构建和优化多模态联合训练模型,实现自动化、智能化的视觉内容布局生成(如杂志、UI界面等);
3. 结合各业务场景下相关技术问题进行分析、算法设计,推动算法在工业级场景的部署与应用,沉淀在业界有影响力工作;
包括英文材料
算法+
PyTorch+
TensorFlow+
大模型+
Llama+
CVPR+
ICCV+
ECCV+
还有更多 •••
相关职位

logo of amap
社招2年以上技术类-算法

团队介绍: 高德地图机器学习研发部是公司AI核心技术引擎,聚焦多模态大模型、视频生成与理解、图像编辑与生成等前沿领域。团队深耕人工智能技术落地,支撑亿级用户产品,同时长期投入前沿探索,在NeurIPS/ICLR/CVPR/ACL等顶会发表多篇论文,多项成果入选“最有影响力论文”榜单。我们拥有海量数据与算力资源,鼓励创新突破,诚邀你与顶尖算法专家并肩,共同定义AI的未来!如果你渴望挑战多模态与生成式AI的技术巅峰,在视频、图像、大模型的交叉领域实现突破,欢迎加入我们!团队的github页面是:https://github.com/AMAP-ML/ 我们提供 • 参与亿级用户产品的AI核心算法研发,见证技术直接赋能业务; • 与学术大牛和工业界专家共事,持续提升技术视野; • 顶配算力资源+开放创新氛围,支持前沿探索与顶会论文发表。 具体职责包含但不限于: 1. 视觉理解任务的技术探索,要求对视觉基础任务有深入的理解,做好在商品理解、详情页的文图内容、开放图片识别等公司核心业务上的落地; 2. 多模态大模型的技术探索,要求对多模态大模型训练、文图跨模态对齐等有深入实践,做好多模态大模型的能力构建和应用; 3. 追踪领域前沿工作,沉淀技术,投稿领域顶级会议。

更新于 2025-11-03北京
logo of baidu
社招MEG

-参与LLM和AIGC核心算法工作,基于海量的内容(文本、图像、视频)及前沿的大模型,支持文教互娱的算法工作,提高业务效果 -利用LLM前沿技术方向,负责AI内容生成和编辑(prompt设计、大模型SFT和预训练,大模型强化学习等)、内容理解和质量识别(质量分级、内容结构化、智能标签/摘要,优质文案等)、场景应用(需求理解、用户刻画、个性化推荐)等 -熟悉AIGC前沿技术,例如:CLIP,Stable Diffusion,ControlNet,Imagen,Dreambooth等。结合大模型(文心一言)和AIGC技术,支撑PPT生成、个人简历、对话系统等多模态场景 -关注用户体验提升,通过对数据的洞察,深入挖掘产品潜在价值和需求,通过技术创新推动产品成长

更新于 2025-02-05北京
logo of kuaishou
社招3-5年J0011

1、负责多模态生成算法研发,如Diffusion Models 、 GAN 、 VAE 、 Autoregressive Models等,包括但不限文本/图像/视频生成,解决生成质量、多样性、可控性、采样效率、可编辑等问题; 2、负责端到端多模态生成式大模型的框架设计、训练与调优,构建基于生成模型的AI系统,推动多模态AIGC在快手各业务场景的产品化落地; 3、负责百亿/千亿参数量的多模态生成大模型研发,实现关键技术突破,并将前沿算法技术转化为创新产品。

更新于 2026-04-01北京
logo of kuaishou
社招3-5年J0011

1、从事AIGC领域的算法探索和落地开发,负责项目规划与前沿技术推进;负责视觉生成基础模型的框架设计与预训练,以及面向实际应用的优化; 2、研发方向包括但不限于图像/视频/3D图形的生成,重点解决低成本、高品质生成以及可控编辑等关键问题。

更新于 2026-03-30北京