logo of honor

荣耀AI多模融合感知算法工程师

校招全职研发类地点:深圳 | 西安状态:招聘

任职要求


1、计算机软件、人工智能、生物医学工程、神经科学等相关专业,具备较强的学习能力及创新能力;
2、对机器学习深度学习基础理论有深刻理解,有多模融合算法的研发经历,能够完成算法设计、仿真、实现和验证;…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、基于手机、Pad、PC、手表、耳机、电视、路由等终端设备,通过AI多模多设备融合算法识别用户状态(身份识别、行为识别、运动健康、人机交互等),例如通过生理特征、行为特征、图像音频特征的融合,识别机主、年龄、性别、交通工具、生理心理健康、活动行为和人机交互;
2、跟踪感知算法最新理论和技术发展,提出创新型的解决方案,以实现关键技术突破;
3、从事本领域特性的端到端评估,推动用户体验提升,对产品上市后的质量表现负责。
包括英文材料
机器学习+
深度学习+
算法+
Python+
还有更多 •••
相关职位

logo of meituan
社招3年以上核心本地商业-业

1.参与美团闪购海量商品的商品理解,服务好商家建品、后台管品及用户体验; 2.负责探查大模型技术在美团闪购供给场景的应用,包括智能助手、内容判别/生成、AI Agent等; 3.有机会负责创新AI功能端到端的开发,需要全方位地思考问题,能够算法技术栈中承担不同角色,解决各个环节问题。

更新于 2025-03-10北京
logo of baidu
实习ACG

-负责落地多模态大模型在多模态理解场景中的应用,负责多模态理解与审核场景端到端效果优化与提升 -重点研究文本、图像相关的多模态大模型相关的技术,包括但不限于数据建设、指令微调、模型优化、模型蒸馏等,提升数据构建合成、模型推理等能力 -构建大小模型融合的多模态推理系统,提升模型在理解与审核场景中的效果 -持续探索跟进学术与业界前沿进展,探索包括但不限于多模态CoT、多模态RAG、强化学习微调等能力并落地

更新于 2025-09-22北京
logo of aliyun
实习阿里云研究型实习

Lindorm数据库的定位是AI时代的海量多模数据平台,目前Lindorm针对高并发在线、泛时序数据、搜索和AI几个主要业务场景提供了多模数据的存储、检索、分析与AI推理服务。如何实现针对多个不同业务场景下复杂各异数据模型的高效存储与处理,以及探索如何更好利用AI来对非结构化数据进行分析和理解,实现结构化数据与非结构化数据的融合处理,都存在巨大的挑战。如今AI技术发展迅速,我们希望能够进一步探索多模数据和AI结合的更多场景,将Lindorm数据库打造成AI应用的基础设施。 基于以上背景,本项目重点聚焦如下技术问题的研究: 1、探索如何在一个统一的数据库框架和底座下高效存储和处理包括宽表、时序、JSON、向量等复杂数据模型; 2、探索数据库如何更好地利用Data + AI来增强数据库分析和处理文本、图像、语音和视频等非结构化数据的能力,方便用户开发和部署AI应用,挖掘数据价值。

更新于 2024-07-15杭州
logo of quark
实习日常实习生

我们是谁: -事业群简介:我们是阿里智能信息事业群,专注于千问APP、夸克APP、AI眼镜等AI to C的业务,为2亿用户群体提供AI服务,你或你身边的小伙伴中可能就是我们的用户。我们是一支致力于在AI赛道长期发展、创新务实的团队,欢迎每一位有想法、对AI有热情的小伙伴和我们一起参与这个令人激动的过程。 -团队简介:我们是“千问相机”背后的多模搜索&问答算法团队,负责构建面向千问APP、夸克APP、AI眼镜等产品的统一多模态搜索技术体系,我们基于百亿级图文/视频库及海量用户真实场景需求,攻克多模态对齐与检索难题,探索大模型与搜索的深度融合,支撑全网搜索、智能拍搜、多模态RAG等关键场景。团队技术氛围浓厚,工作氛围开放包容,加入我们,与顶尖工程师共同成长! 你会参与到: 1、多模态PlannCoT,理解用户图文query并规划合理的工具调用路径,为生成提供多模态内容供给 2、通过VLM post-training技术提升模型在行业知识、多轮对话、RA引用、偏好对齐等专项能力 3、构建多模态数据生产体系,提升模型在数字化内容理解、图文对齐、图表理解等内化能力 4、探索强化学习在复杂交互场景中的应用,尤其是多模态planning、视觉reasoning

更新于 2025-12-03杭州