logo of tencent

腾讯微信-多模态大模型算法工程师-OCR与文档理解方向(北京)

社招全职1年以上WXG公共技术地点:深圳状态:招聘

任职要求


1.深度参与过业界主流或知名多模态大模型的研发工作,系统理解整体技术架构与设计方案。具备大规模数据构建、清洗、治理及分布式模型训练的实战经验。
2.精通大模型预训练、监督微调(SFT)、对齐与后训练(如 RLHF / DPO 等)等训练范式,深入理解相关算法原理、工程实现细节及训练稳定性与效率优化方法。
3.精通通用 OCR、表格识别、版面分析、关键信息抽取(KIE)等文档智能核心技术,具备完整的业务落地或产品…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责微信在OCR、文档理解等垂类方向的多模态大模型技术研发和业务落地,支持相关模型在微信C端应用,以及视频号、公众号、微信小店等业务的搜索、推荐、审核等领域的应用。
包括英文材料
大模型+
系统设计+
SFT+
RLHF+
算法+
OCR+
OpenCV+
CVPR+
还有更多 •••
相关职位

logo of tencent
社招1年以上WXG公共技术

负责微信视觉基座模型的核心技术研发与业务落地,构建统一的视觉理解与解析能力,支持在微信C端及视频号、公众号、微信小店等业务场景中的规模化应用。

更新于 2026-03-25深圳
logo of tencent
社招3年以上企业微信SaaS

1.负责多模态大模型(如音视频理解、视觉问答、图像生成等)的技术研究、应用落地与性能优化; 2.研发和优化基于大模型的多模态应用; 3.收集和构建高质量的多模态数据集,并进行模型的训练、微调和提示工程(Prompt Engineering); 4.将多模型算法高效地集成到企业微信客户端,与客户端团队合作解决端侧部署和推理的挑战; 5.紧跟多模态领域(如CLIP, BLIP, Stable Diffusion, Sora等)的技术前沿,推动技术创新在产品中落地。

更新于 2025-12-24广州
logo of tencent
社招3年以上企业微信SaaS

1.负责多模态大模型(如音视频理解、视觉问答、图像生成等)的技术研究、应用落地与性能优化; 2.研发和优化基于大模型的多模态应用; 3.收集和构建高质量的多模态数据集,并进行模型的训练、微调和提示工程(Prompt Engineering); 4.将多模型算法高效地集成到企业微信客户端,与客户端团队合作解决端侧部署和推理的挑战; 5.紧跟多模态领域(如CLIP, BLIP, Stable Diffusion, Sora等)的技术前沿,推动技术创新在产品中落地。

更新于 2026-01-09成都
logo of tencent
社招3年以上企业微信SaaS

1.负责企业微信音频 AI 相关算法的研究与落地,包括但不限于语音识别(ASR)、语音合成(TTS)、声纹识别、音色转换等方向; 2.负责热词定制、领域自适应、说话人分离等场景化能力的算法设计与优化; 3.探索音频大模型在企业办公场景的创新应用,推动模型训练、微调及端侧部署落地; 4.跟进语音/音频领域前沿技术进展(Whisper、SpeechGPT 等),持续提升核心指标与用户体验; 5.与客户端、后台团队协作,完成算法从原型验证到工程化落地的全链路交付。

更新于 2026-03-31成都