百度大模型算法工程师(VLM 方向)(J98540)
社招全职ACG地点:北京状态:招聘
任职要求
-计算机、人工智能、数学或相关专业本科及以上学历,Python 编程能力扎实,深入理解 Transformer 及主流多模态模型架构原理 -具备 VLA 或 GUI Agent 多模态模型的实际训练、微调与上线经验,QwenVL 系列…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
-负责 GUI Agent 专用 VLA 模型的训练与微调,包括基于 Qwen-VL、Qianfan-VL 等多模态模型的架构设计与实验迭代 -主导后训练全流程(SFT → RM → RL)的算法设计与落地,具备 RLHF / DPO 等对齐方法的工程实践经验 -设计并落地 GUI 操作轨迹数据的自动化采集、清洗与标注 Pipeline,推动数据飞轮闭环,驱动模型持续进化 -主导模型推理加速与生产部署,熟悉 vLLM、TensorRT-LLM 等推理框架及量化技术,持续优化端到端时延与吞吐量 -研究并落地适用于 GUI Agent 场景的高阶推理机制(多步规划、自我反思、动作验证等),持续跟踪前沿进展
包括英文材料
学历+
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
还有更多 •••
相关职位
校招研发类
1、针对物流领域场景进行深入的视觉算法研发,包括但不限于图像理解、视频理解等; 2、负责垂域多模态大模型的继续预训练、SFT、RFT等工作,积极跟进大模型业内应用趋势,包括但不限于MoE、Agent等方向。
更新于 2025-08-19深圳
校招研发类
1、针对物流领域场景进行深入的视觉算法研发,包括但不限于图像理解、视频理解等; 2、负责垂域多模态大模型的继续预训练、SFT、RFT等工作,积极跟进大模型业内应用趋势,包括但不限于MoE、Agent等方向。
更新于 2026-03-05深圳