腾讯微信-多模态大模型算法工程师-OCR与文档理解方向（北京）

社招全职1年以上WXG公共技术2026-03-25地点：深圳状态：招聘

扫码手机上打开

任职要求

1.深度参与过业界主流或知名多模态大模型的研发工作，系统理解整体技术架构与设计方案。具备大规模数据构建、清洗、治理及分布式模型训练的实战经验。
2.精通大模型预训练、监督微调（SFT）、对齐与后训练（如 RLHF / DPO 等）等训练范式，深入理解相关算法原理、工程实现细节及训练稳定性与效率优化方法。
3.精通通用 OCR、表格识别、版面分析、关键信息抽取（KIE）等文档智能核心技术，具备完整的业务落地或产品…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

负责微信在OCR、文档理解等垂类方向的多模态大模型技术研发和业务落地，支持相关模型在微信C端应用，以及视频号、公众号、微信小店等业务的搜索、推荐、审核等领域的应用。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

大模型+

系统设计+

SFT+

RLHF+

算法+

OCR+

OpenCV+

CVPR+

还有更多 •••

登录查看完整学习资料

相关职位

微信-多模态大模型算法工程师–视觉基座模型方向（北京）

社招1年以上WXG公共技术

负责微信视觉基座模型的核心技术研发与业务落地，构建统一的视觉理解与解析能力，支持在微信C端及视频号、公众号、微信小店等业务场景中的规模化应用。

更新于 2026-03-25深圳

企业微信-多模态大模型算法工程师 -音频方向

社招3年以上企业微信SaaS

1.负责企业微信音频 AI 相关算法的研究与落地，包括但不限于语音识别（ASR）、语音合成（TTS）、声纹识别、音色转换等方向； 2.负责热词定制、领域自适应、说话人分离等场景化能力的算法设计与优化； 3.探索音频大模型在企业办公场景的创新应用，推动模型训练、微调及端侧部署落地； 4.跟进语音/音频领域前沿技术进展（Whisper、SpeechGPT 等），持续提升核心指标与用户体验； 5.与客户端、后台团队协作，完成算法从原型验证到工程化落地的全链路交付。

更新于 2026-06-29广州|成都

企业微信-多模态大模型算法工程师

社招3年以上企业微信SaaS

1.负责多模态大模型（如音视频理解、视觉问答、图像生成等）的技术研究、应用落地与性能优化； 2.研发和优化基于大模型的多模态应用； 3.收集和构建高质量的多模态数据集，并进行模型的训练、微调和提示工程（Prompt Engineering）； 4.将多模型算法高效地集成到企业微信客户端，与客户端团队合作解决端侧部署和推理的挑战； 5.紧跟多模态领域（如CLIP, BLIP, Stable Diffusion, Sora等）的技术前沿，推动技术创新在产品中落地。

更新于 2026-01-09成都

企业微信-多模态大模型算法工程师 -音频方向

社招3年以上企业微信SaaS

更新于 2026-03-31成都