logo of tencent

腾讯微信-多模态大模型算法工程师–视觉基座模型方向(北京)

社招全职1年以上WXG公共技术地点:深圳状态:招聘

任职要求


1.深度参与过业界主流视觉基础模型或多模态大模型的研发工作,系统理解整体技术架构与训练方法。
2.精通大规模模型训练范式,包括预训练(Pretraining)、监督微调(SFT)、多任务联合训练、蒸馏训练、后训练(如 RLHF/DPO 等),理解训练稳定性及效率优化方法。
3.熟悉视觉核心任务中的一种或多种,包括目标检测、分割、图片理解或视觉语言模型(VLM)等方向,熟悉 VLM for Grounding。
4.具…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责微信视觉基座模型的核心技术研发与业务落地,构建统一的视觉理解与解析能力,支持在微信C端及视频号、公众号、微信小店等业务场景中的规模化应用。
包括英文材料
大模型+
系统设计+
SFT+
RLHF+
OpenCV+
机器学习+
CVPR+
ICCV+
ECCV+
还有更多 •••
相关职位

logo of tencent
社招1年以上WXG公共技术

负责微信在OCR、文档理解等垂类方向的多模态大模型技术研发和业务落地,支持相关模型在微信C端应用,以及视频号、公众号、微信小店等业务的搜索、推荐、审核等领域的应用。

更新于 2026-03-25深圳
logo of tencent
社招3年以上企业微信SaaS

1.负责多模态大模型(如音视频理解、视觉问答、图像生成等)的技术研究、应用落地与性能优化; 2.研发和优化基于大模型的多模态应用; 3.收集和构建高质量的多模态数据集,并进行模型的训练、微调和提示工程(Prompt Engineering); 4.将多模型算法高效地集成到企业微信客户端,与客户端团队合作解决端侧部署和推理的挑战; 5.紧跟多模态领域(如CLIP, BLIP, Stable Diffusion, Sora等)的技术前沿,推动技术创新在产品中落地。

更新于 2025-12-24广州
logo of tencent
社招3年以上企业微信SaaS

1.负责多模态大模型(如音视频理解、视觉问答、图像生成等)的技术研究、应用落地与性能优化; 2.研发和优化基于大模型的多模态应用; 3.收集和构建高质量的多模态数据集,并进行模型的训练、微调和提示工程(Prompt Engineering); 4.将多模型算法高效地集成到企业微信客户端,与客户端团队合作解决端侧部署和推理的挑战; 5.紧跟多模态领域(如CLIP, BLIP, Stable Diffusion, Sora等)的技术前沿,推动技术创新在产品中落地。

更新于 2026-01-09成都
logo of tencent
社招5年以上搜一搜技术

1.岗位职责; 2.负责视频、商品等搜索产品的相关性算法设计和优化,紧贴业务需求,持续优化技术方案以提升业务效果; 3.负责多模态大模型方向的技术研究和技术能力基建,提升跨模态语义理解与匹配精度; 4.跟踪前沿研究进展,根据实际应用场景不断改进与优化,并落地业务场景中。

更新于 2025-12-11北京