小红书【2026校招】视觉与多模态算法工程师
任职要求
1、硕士及以上学历,计算机等相关专业优先; 2、熟练掌握TensorFlow/PyTorch/Caffe/ MXNet等深度学习框架中的至少一种; 3、具备优秀的编程能力和经验,熟悉Python、C/C++、Java等编程语言,对数据结构和算法设计有较为深刻的理解; 4、优秀的分析和解决问题能力,对新技术充满好奇,敢于挑战高难度,善于提出解决方案并快速验证; 5、了解Diffusion、LLM、VLM、Agent等前沿技术; 6、关注多模态与文本生成领域的业界最新动态,如Qwen、Gemini、Claude、chatGPT等; 7、具备优秀的研究和创新能力,在NIPS/AAAI/ICML/ICLR/CVPR/TPAMI/ACL/EMNLP/ECCV/ICCV/SIGGRAPH等会议/期刊上发表过论文者和参加过ACM竞赛者优先。
工作职责
创作发布算法方向: 1、负责图像编辑、视频剪辑、文案创作等内容创作相关算法的研发与优化,并在社区发布、商业化&电商创作等场景落地; 2、跟进多模态大模型内容生产、Agent等相关技术的最新发展趋势,保持技术先进性,持续探索Agent在内容创作方面的潜力。 内容理解方向: 1、负责多模态内容理解、图像理解以及NLP相关的算法研发工作,提升搜索、广告、推荐、创作发布的效果和体验; 2、负责包括但不限于多模态大模型Pre/PostTrain、数据挖掘,持续优化并突破业界SOTA效果,兼具落地以获取业务线上收益; 3、紧密关注相关领域业界的最新进展,时刻保持技术先进性,探索前沿技术的落地结合点。 AIGC生成方向: 1、负责多模态生成/GAN/Diffusion等图像&视频生成相关算法研发与优化, 跟进该领域的前沿技术研究; 2、参与技术规划制定, 跟进图像&视频生成技术最新发展趋势,打造业内领先的多模态内容生成能力。; 3、推动技术在图像&视频编辑/素材生成/辅助设计/特效等领域的应用。
创意是内容的呈现方式,而文本、图像、视频和模版是创意的重要载体。探索文生图/图片编辑技术、文生视频/视频编辑技术和LLM/MLLM技术分别在增长、广告、营销、社区等领域的应用,生成质量高且有投放竞争力的素材。 1、负责 lmage-to-Video、Text-to-Video、Animation 等视频内容生成算法研发,从视频素材和视频创意玩法两个维度进行落地; 2、基于 Stable Diffusion 的图像内容研发,包括算法开发、模型微调、性能优化、模型服务化等工作,重点解决生成质量、多样性、可控性、可编辑等问题; 3、基于diffusion技术的创意元素生成,如海报、icon、banner、艺术字体、Layout、3D商品展示等; 4、解决业务落地中的关键技术问题,持续跟进业界AIGC 技术最新进展,加速新技术的引进、适配与优化。
Top Seed人才计划-豆包大模型研究实习生专项:面向 2025 年 9 月及以后毕业的博士及本硕在读同学,加入我们,你可以自主决定研究课题,与正式员工享受同等权限和资源,和优秀的研究员一起,向智能上限发起挑战。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与视觉多模态领域的前沿算法研究,发表国际顶级论文、申请专利; 2、深入调研和关注多模态/NLP/CV等方向的前沿技术,应用解决业界实际问题的机会以及经验; 3、良好的团队氛围,丰富的计算和数据资源。
Top Seed人才计划-豆包大模型研究实习生专项:面向 2025 年 9 月及以后毕业的博士及本硕在读同学,加入我们,你可以自主决定研究课题,与正式员工享受同等权限和资源,和优秀的研究员一起,向智能上限发起挑战。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与视觉多模态领域的前沿算法研究,发表国际顶级论文、申请专利; 2、深入调研和关注多模态/NLP/CV等方向的前沿技术,应用解决业界实际问题的机会以及经验; 3、良好的团队氛围,丰富的计算和数据资源。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 如果你,期望参与淘天集团海量图像/视频数据的理解、分发、生成等方面的算法研究、系统研发和产品开发; 如果你,期望参与图像/视频相关算法的前沿技术探索,包括机器学习及深度学习在内容理解和AIGC中的应用,以及计算机视觉与自然语言处理、计算机图形学等相关领域的联合创新; 如果你,期望和聪明、皮实、乐观、自省、追求卓越和自我驱动的优秀战友一起,共同开创视觉技术的新格局; 那还在等待什么,赶紧加入我们吧! T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。