logo of tencent

腾讯微信-多模态大模型算法工程师-OCR与文档理解方向(北京)

社招全职1年以上WXG公共技术地点:深圳状态:招聘

任职要求


1.深度参与过业界主流或知名多模态大模型的研发工作,系统理解整体技术架构与设计方案。具备大规模数据构建、清洗、治理及分布式模型训练的实战经验。
2.精通大模型预训练、监督微调(SFT)、对齐与后训练(如 RLHF / DPO 等)等训练范式,深入理解相关算法原理、工程实现细节及训练稳定性与效率优化方法。
3.精通通用 OCR、表格识别、版面分析、关键信息抽取(KIE)等文档智能核心技术,具备完整的业务落地或产品…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责微信在OCR、文档理解等垂类方向的多模态大模型技术研发和业务落地,支持相关模型在微信C端应用,以及视频号、公众号、微信小店等业务的搜索、推荐、审核等领域的应用。
包括英文材料
大模型+
系统设计+
SFT+
RLHF+
算法+
OCR+
OpenCV+
CVPR+
还有更多 •••
相关职位

logo of tencent
社招1年以上WXG公共技术

负责微信视觉基座模型的核心技术研发与业务落地,构建统一的视觉理解与解析能力,支持在微信C端及视频号、公众号、微信小店等业务场景中的规模化应用。

更新于 2026-03-25深圳
logo of tencent
社招3年以上企业微信SaaS

1.负责多模态大模型(如音视频理解、视觉问答、图像生成等)的技术研究、应用落地与性能优化; 2.研发和优化基于大模型的多模态应用; 3.收集和构建高质量的多模态数据集,并进行模型的训练、微调和提示工程(Prompt Engineering); 4.将多模型算法高效地集成到企业微信客户端,与客户端团队合作解决端侧部署和推理的挑战; 5.紧跟多模态领域(如CLIP, BLIP, Stable Diffusion, Sora等)的技术前沿,推动技术创新在产品中落地。

更新于 2025-12-24广州
logo of tencent
社招3年以上企业微信SaaS

1.负责多模态大模型(如音视频理解、视觉问答、图像生成等)的技术研究、应用落地与性能优化; 2.研发和优化基于大模型的多模态应用; 3.收集和构建高质量的多模态数据集,并进行模型的训练、微调和提示工程(Prompt Engineering); 4.将多模型算法高效地集成到企业微信客户端,与客户端团队合作解决端侧部署和推理的挑战; 5.紧跟多模态领域(如CLIP, BLIP, Stable Diffusion, Sora等)的技术前沿,推动技术创新在产品中落地。

更新于 2026-01-09成都
logo of tencent
社招2年以上WXG公共技术

1.负责微信多模态大模型的前沿研究和业务落地; 2.充分利用微信视频号、公众号等数据优势,打造中文能力顶尖的图文、视频多模态大模型。

更新于 2025-06-25北京