百度多模态大模型算法工程师(J83810)
任职要求
- 具备机器学习/深度学习/自然语言处理/计算机视觉视觉的理论背景和实践经验 - 熟练掌握Python编程语言以及Pytorch、Tensorflow、PaddlePaddle等其中一项深度学习开发框架 - 具有较好的团队沟通合作能力、分析问题和解决问题的能力 - 熟练掌握预训练模型的算法原理和实现细节、有大规模模型预训练实践经验、发表相…
工作职责
- 参与文本、图像、视频等生成式大模型的等算法策略研究,打造业内领先的商业多模态生成大模型 - 利用大模型技术,将最新算法应用于产品开发中,推动大模型技术的实际应用与创新落地 - 与产品及研发团队紧密协作,精准把握业务需求,持续优化商业业务场景下的大模型的技术方案 - 研究高效模型调优方法和高质量数据构建策略,同时关注大模型的前沿技术和未来趋势
我们正在寻找对多模态技术充满热情的算法工程师,加入我们的前沿技术研发团队。您将专注于多模态理解与生成,推动其在地图数据、信息流推荐、打车服务等场景中的落地应用,为用户提供更智能、更沉浸的服务。 主要职责 1、多模态模型研发:开发业界领先的图文多模态理解与生成模型,结合扩散模型(Diffusion Models)、Transformer架构等实现高质量场景理解和动态内容生成。 2、模型优化与性能提升:优化多模态模型的推理速度和计算效率,支持端侧部署。探索适合大模型的压缩与加速技术(包括但不限于量化、剪枝、知识蒸馏等)。 3、业务场景落地:将多模态技术应用于实际业务场景,如地图数据(道路、POI等)、信息流推荐、打车服务等。与产品、工程团队合作,推动技术从研发到上线的全流程落地。 4、前沿技术探索:持续跟踪生成式AI(Generative AI)、跨模态对齐、思维链强化学习、多模态交互、具身智能等最新技术趋势,提出创新性解决方案。
1. 围绕业务场景,进行大模型研发和落地,不限于LLM、多模态大模型SFT、Agent; 2. 研究和实现新的算法和技术,以提高模型的性能和效率; 3. 与团队合作,将研究成果转化为实际的产品功能。
职位描述 面向淘天自营业务场景,探索大模型与推荐算法结合的下一代推荐系统技术,充分利用大模型的领域知识和学习范式为推荐系统注入新动力,包括但不限于生成式推荐、模型Scaling Law、用户超长序列建模等,解锁更大的算法提升空间; 1.负责大语言模型、多模态大模型的训练,探索预训练表征的高效处理方式以及与推荐系统的结合方式,让推荐系统充分理解世界知识; 2.基于类Transformer架构的设计和升级推荐大模型,验证推荐的Scaling Law,探索兼顾性能和效果的模型技术,持续提升业务场景效果; 3.结合业务目标和场景特点,探索并利用大语言模型技术对现有推荐系统的各环节进行优化改进,探索并开发生成式推荐系统技术,提升用户体验,实验业务价值; 4.持续关注行业内人工智能技术的发展趋势,结合业界前言技术和业务需求,和工程同学一起探索&打造大模型应用的最佳实践,提升业务效果和用户体验;