logo of baidu

百度多模态算法工程师(J82286)

社招全职ACG地点:北京状态:招聘

任职要求


-本科及以上学历,计算机、模式识别、人工智能、软件工程相关专业优先
-熟练掌握PyTorch、TensorFlow、PaddlePaddle等至少一种主流深度学习框架,…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


-负责落地LLM在内容理解场景中的应用,负责文本内容理解与审核场景端到端效果优化与提升
-重点研究以小尺寸大语言模型相关的技术,包括但不限于数据建设、指令微调、模型优化、模型蒸馏等
-提升数据构建合成、模型推理等能力;构建大小模型融合的推理系统,提升模型在理解与审核场景中的效果
-持续探索跟进学术与业界前沿进展,探索包括但不限于CoT、RAG、强化学习微调等能力并落地
包括英文材料
Python+
深度学习+
学历+
模式识别+
还有更多 •••
相关职位

logo of xiaohongshu
社招大模型

在算力驱动的 AGI 和人文精神的烟火气交汇之处,我们真诚邀请对大模型 Omni Model 有热情的同学加入,共同打造更具影响力的智能系统。你会成为团队的一员,并和其他同事协作,共同研发 SOTA 的 Omni Model。期待你以务实和客观的科学态度来推进技术的进展,不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态。 区别于传统 ASR / TTS 级联技术,我们希望打造端到端的 Omni Model 在实时交互中释放大模型的智力水平,彻底改变以 Chatbot 文字为主的人机交互界面 岗位说明:你会负责围绕大模型 Omni Model 构建语音模态的相关研究工作,包括但不限于如下事项 海量的语音数据处理和构建:定性分析、定量评估数据质量,并给出 scalable 的改进方案;探索跨模态(文字/视觉/语音)混合训练的最佳实践; 探索更加高效且合理的模型架构,让模型更加理解音频,同时让模型具备更好的语音合成能力 研究并探索基于 Omni Model 的 Post Train,包含但不限于 SFT 和 RL

北京|上海
logo of ke
社招3年以上图像技术组

1.负责贝壳多模态数据下的多模态大模型增量预训练、指令微调,以及面向下游垂直领域任务的效果优化; 2.结合自有产品和业务需求,负责跨模态检索、多模态分类、多模态表征等模型研发与应用,解决面向业务场景的应用和落地时的算法卡点问题; 3.负责搭建多模态大模型dataset和benchmark的收集、清洗和评测体系; 4.与工程、产品团队配合,推动团队成果的应用落地。

更新于 2025-02-24北京
logo of kuaishou
社招5年以上D7244

1、参与多模态算法的研究和开发; 2、探索基于多模态的内容理解,并应用于风控,视频质量等核心业务中。

更新于 2025-04-10北京
logo of meituan
社招3年以上核心本地商业-点

1.利用计算机视觉和人工智能技术,改进点评笔记、评价等多个点评创作产品的创作体验。 2.参与研发以计算机视觉和人工智能技术为核心的创新型内容玩法。 3.探索MLLM,LLM,VLM等相关算法前沿,应用于业务并解决实际业务问题。 4.负责对业务场景下相关技术问题进行分析、算法设计和上线,全面参与并推动各环节的高效运行,以实现持续的业务价值提升。 5.研究并开发智能Agent系统,优化用户与AI系统的交互体验。

更新于 2025-12-02北京|上海