
商汤算法研究实习生
任职要求
1. 教育背景:国内外知名院校本科及以上学历在读,计算机科学、人工智能、数学、统计学、电子信息等相关专业优先,2026 届及以后毕业的同学均可投递。 2. 专业技能:熟悉机器学习、深度学习的基础理论,对自然语言处理、计算机视觉等领域有一定了解,有相关课程项目或实践经验者优先。 3. 熟练掌握 Python 编程语言,具备扎实的编程基础和良好的代码风格,能够独立完成算法代码实现和调试。 4. 熟悉至少一种主流深度学习框架(如 PyTorch、TensorFlow),能够运用框架搭建和训练模型,了解框架底层原理者更佳。 5. 具备较强的学习能力和创新思维,对新技术充满热情,能够快速掌握新知识并应用到实际工作中,善于从不同角度思考…
工作职责
1. 算法研究与创新:调研和探索基于多模态大模型的 Agent 相关前沿机器学习、深度学习算法,参与构建和优化 Agent 算法基础模型。 2. 数据处理与分析:协助收集、整理用于训练 UI Agent 的数据,涵盖多种类型的 UI 界面截图、用户操作日志等,运用数据分析工具和方法,对数据进行深入分析,挖掘数据中的潜在模式和规律,为算法优化提供数据支持 3. 模型实现与测试:基于主流深度学习框架(如 PyTorch),将设计好的算法模型进行代码实现,参与模型的训练、调试与优化工作,提高模型性能。制定并执行模型测试方案,评估模型在模拟和真实 UI 场景下的表现,如任务完成率、操作准确性等指标,根据测试结果提出改进建议并实施优化。 4. 协作与沟通:与团队内的其他算法研究人员、工程师密切协作,共同推进项目进展,及时交流研究思路和技术难题,分享研究成果和经验。

1. 参与多模态语音交互场景下的语音理解、语音生成和语音交互大模型的算法研发、性能优化与落地实现; 2.参与数字人场景下的个性化实时情感对话语音合成、低资源音色克隆、语音识别、语音增强、语音检测、语种识别、声纹识别、说话人分割、变声、音乐生成等技术研发; 3.参与语音相关算法引擎的流式改造、推理优化、大并发低延迟云服务、私有化服务定制开发; 4.跟进学术界、行业最新的研究趋势,产出新的科研成果,并落地于实际产品。

1. 辅助开展计算机视觉和深度学习算法的开发与性能提升,研究的问题包括但不限于:2D/3D物体检测与跟踪、物体6D姿态估计、人体姿态估计、物体人体在线重建、人体运动捕捉、语义分割、动态场景重建、视觉定位与导航等。 2. 紧跟学术前沿,开展高水平和创新性的研究,保持算法在工业界和学术界的领先,参与顶会论文投稿及专利申请。 3. 负责开发管理研究所需要的工具以及基础设施。 岗位优势: 1. 介于工业界与学术界之间,用前沿研究解决实际问题 2. 拥有丰富的数据与计算资源 3. 与科研和工程经验丰富的同事共事,有机会得到合作教授的科研指导

1. 辅助开展计算机视觉和深度学习算法的开发与性能提升,研究的问题包括但不限于:2D/3D物体检测与跟踪、物体6D姿态估计、人体姿态估计、物体人体在线重建、人体运动捕捉、语义分割、动态场景重建、视觉定位与导航等。 2. 紧跟学术前沿,开展高水平和创新性的研究,保持算法在工业界和学术界的领先,参与顶会论文投稿及专利申请。 3. 负责开发管理研究所需要的工具以及基础设施。 岗位优势: 1. 介于工业界与学术界之间,用前沿研究解决实际问题 2. 拥有丰富的数据与计算资源 3. 与科研和工程经验丰富的同事共事,有机会得到合作教授的科研指导