腾讯微信-多模态生成算法研究员(北京)
社招全职1年以上WXG公共技术地点:深圳状态:招聘
任职要求
1. 人工智能、计算机、自动化等相关相关专业,硕士及以上学历,有多模态理解、图片生成、视频生成等大模型项目经验; 2. 有扎实的技术基础和代码能力,熟悉linux和python,精通扩散模型、自回归模型、transform架构、模…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
参与微信自研多模态生成基座的全链路研发,包括但不限于图片生成和编辑、视频生成、理解生成统一模型、可控生成、模型压缩等方向,参与构建高效的多模态数据引擎、探索下一代生成模型架构、设计全流程训练策略、构建高质量的评测体系等,打造符合微信业务生态的多模态生成AI系统。
包括英文材料
学历+
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
Linux+
https://ryanstutorials.net/linuxtutorial/
Ok, so you want to learn how to use the Bash command line interface (terminal) on Unix/Linux.
https://ubuntu.com/tutorials/command-line-for-beginners
The Linux command line is a text interface to your computer.
https://www.youtube.com/watch?v=6WatcfENsOU
In this Linux crash course, you will learn the fundamental skills and tools you need to become a proficient Linux system administrator.
https://www.youtube.com/watch?v=v392lEyM29A
Never fear the command line again, make it fear you.
https://www.youtube.com/watch?v=ZtqBQ68cfJc
还有更多 •••
相关职位
社招2年以上微信读书技术
1.负责多模态内容理解、多模态生成等算法技术在视频剪辑、多模态理解和生成业务上的落地工作:; 2.图像、视频、语音等多模态内容理解和生成算法的模型设计、训练、优化; 3.文生图、文生视频、图生视频等算法的探索和落地; 4.实现模型轻量化(知识蒸馏、量化剪枝)及推理加速,满足低延迟需求; 5.跟踪多模态大模型、世界模型等前沿方向,探索业务结合点。
更新于 2025-07-30北京|广州
社招2年以上微信读书技术
1.负责微信读书以及音视频应用的高质量深度理解、生成任务的设计和构建; 2.负责读书产品部的 Multi-Agents 系统的构建,探索多种模态内容的深度创作并落地; 3.负责前沿算法技术的研究和探索,包括但不限于 RL,DeepResearch,Long Context 等; 4.负责读书产品部多个 AI 应用的 AI Agent Memory 系统的构建和优化。
更新于 2026-02-13北京
社招3年以上企业微信SaaS
1.负责多模态大模型(如音视频理解、视觉问答、图像生成等)的技术研究、应用落地与性能优化; 2.研发和优化基于大模型的多模态应用; 3.收集和构建高质量的多模态数据集,并进行模型的训练、微调和提示工程(Prompt Engineering); 4.将多模型算法高效地集成到企业微信客户端,与客户端团队合作解决端侧部署和推理的挑战; 5.紧跟多模态领域(如CLIP, BLIP, Stable Diffusion, Sora等)的技术前沿,推动技术创新在产品中落地。
更新于 2025-12-24广州