
商汤智慧零售-算法研究员
任职要求
1、本科及以上学历,计算机、电子信息或软件等相关专业,熟悉计算机视觉、机器视觉、深度学习(检测模型训练优先)等方向。 2、技术能力:熟练使用python,熟悉计算机视觉、深度学习领域最新研究成果,熟悉pytorch…
工作职责
1. 数据处理与管理 收集和整理算法研发所需的原始数据,确保数据的完整性和多样性; 设计高效的数据采集与标注流程,保障数据质量与标注一致性; 撰写清晰的数据采集、标注及管理操作文档; 负责采集和标注任务的进度管理与质量控制。 2. 算法开发与实现 负责计算机视觉或深度学习相关算法的设计、实现与优化; 能够结合业务需求,选择合适的算法技术路线,解决实际场景中的核心问题; 支持项目中算法模块的调研、开发与迭代,保障算法效果与效率。 3. 算法研究与创新 跟踪并学习计算机视觉、深度学习等领域的前沿研究成果; 分析主流算法技术的优劣,探索具有创新性的算法思路; 将最新研究成果转化为工程实践,并在项目中落地验证。 4. 算法部署与上线 负责模型的部署、量化和优化工作,提升模型在实际应用中的性能表现; 对接工程团队,完成模型前后处理逻辑的对齐与集成; 保障模型上线流程的稳定性与准确性,推动算法系统产品化。

1. VLA模型研发: 参与或主导 VLA 模型的架构设计、训练和优化,提升模型在多模态理解和具身任务执行中的性能。 2. 数据闭环建设: 负责具身智能所需的数据采集、标注和处理流程,构建高效的数据闭环系统,以持续优化模型。你将探索新的数据获取方式,包括但不限于利用机器人自身进行自动化数据采集。 3. 具身技能开发: 将 VLA 模型部署到实际机器人平台上,解决模型与机器人硬件之间的集成和适配问题。开发和调试机器人技能,使其能够完成抓取、放置、操作工具等复杂任务。 4. 算法优化与落地: 持续关注具身智能领域的最新研究成果,并将前沿算法应用到实际产品中,解决技术挑战,推动产品性能的迭代升级。
1.负责视频理解相关的算法研究与开发,包括但不限于视频内容分析、动作识别、场景识别等,挖掘视频数据中的关键信息,为业务提供有价值的知识图谱; 2.研发高效的目标检测、跟踪与识别算法,实现对视频中特定目标的精准定位、实时跟踪和分类识别,可应用于安防监控、机器人、智慧零售、智慧巡检,等领域; 3.结合业务场景,开发智能化的场景解决方案,通过图像视频技术实现对场景的智能感知、理解和决策,如智慧零售中的店员客情行为分析等; 4.负责相关算法的工程化实现和优化,确保算法在大规模数据和实时性要求下的高效稳定运行,包括与业务团队合作进行算法的部署和集成; 5.跟踪学术界和工业界的最新研究成果和技术动态,积极参与技术交流和分享,推动团队技术能力的不断提升。

1. VLA模型研发: 参与或主导 VLA 模型的架构设计、训练和优化,提升模型在多模态理解和具身任务执行中的性能。 2. 数据闭环建设: 负责具身智能所需的数据采集、标注和处理流程,构建高效的数据闭环系统,以持续优化模型。你将探索新的数据获取方式,包括但不限于利用机器人自身进行自动化数据采集。 3. 具身技能开发: 将 VLA 模型部署到实际机器人平台上,解决模型与机器人硬件之间的集成和适配问题。开发和调试机器人技能,使其能够完成抓取、放置、操作工具等复杂任务。 4. 算法优化与落地: 持续关注具身智能领域的最新研究成果,并将前沿算法应用到实际产品中,解决技术挑战,推动产品性能的迭代升级。