
商汤26届AI领航员-智慧零售具身智能算法开发工程师
任职要求
1. 扎实的机器学习基础: 熟悉深度学习、强化学习、计算机视觉和自然语言处理等领域的经典算法,并具备丰富的实践经验。 2. VLA或相关经验: 具有 VLA、视觉-语言模型 (VLM) 或视觉-动作模型 (VAM) 的研发经验,有利用大规模多模态数据训练模型的实际项目经验者优先。 3. 具身智能经验: 熟悉机器人操作系统 (ROS),具备机器人硬件相关的开发经验,如控制算法、传感器数据处理(RGB-D相机、IMU等)以及机械臂控制等。 数据闭环经验: 具有构建具身智能数据闭环系统的相关经验,了解如何高效地采集、处理和利…
工作职责
1. VLA模型研发: 参与或主导 VLA 模型的架构设计、训练和优化,提升模型在多模态理解和具身任务执行中的性能。 2. 数据闭环建设: 负责具身智能所需的数据采集、标注和处理流程,构建高效的数据闭环系统,以持续优化模型。你将探索新的数据获取方式,包括但不限于利用机器人自身进行自动化数据采集。 3. 具身技能开发: 将 VLA 模型部署到实际机器人平台上,解决模型与机器人硬件之间的集成和适配问题。开发和调试机器人技能,使其能够完成抓取、放置、操作工具等复杂任务。 4. 算法优化与落地: 持续关注具身智能领域的最新研究成果,并将前沿算法应用到实际产品中,解决技术挑战,推动产品性能的迭代升级。

1. 面向智慧城市大规模图像/视频内容分析场景,参与VLM、MLLM等多模态算法的研究工作,探索城市视觉智能更好的解决方案,帮助下游产品线在行业内建立技术优势; 2. 构建和维护相关研究方向的代码框架、数据基础,紧跟学术前沿,输出创新研究成果。

1. 推动 AI 产品或服务的销售和市场拓展。 2. 根据客户需求提供定制化的产品解决方案。 3. 维护现有客户关系,拓展新客户。 4. 收集市场反馈,协助产品优化。

岗位可以选择训练框架开发/推理优化两个方向 训练框架: 1. 参与深度学习框架的代码实现,开发框架支持大模型训练、微调能力,提升系统件能和系统稳定性。 2. 持续扩充核心框架的功能和计算能力,优化系统的架构和模型设计,保持一定的业务和技术前瞻性。 3.与产品和测试以及其他研发团队深入协作,解决关键问题,完成研发计划。 4.负责大模型训练相关技术,方案及架构设计沟通、规划、撰写。 5.调研分析海内外产品技术实现,探索创新方向。 推理优化: 1. 参与开发大模型推理框架,提升系统性能和系统稳定性。 2. 持续扩充核心框架的功能和计算能力,优化系统的架构和模型设计,保持一定的业务和技术前瞻性。 3.与产品和测试以及其他研发团队深入协作,解决关键问题,完成研发计划。 4.负责大模型推理相关技术,方案及架构设计沟通、规划、撰写。 5.调研分析海内外产品技术实现,探索创新方向.

1. 基于 LazyLLM 框架,负责 LazyRAG 系统的核心模块研发,包括文档解析服务、检索算法优化、问答链路设计及自进化机制的工程实现。 2. 深入参与 RAG 算法迭代:包括切片策略、多粒度索引、Embedding/Reranker 模型升级、Agentic RAG 编排等方向,持续提升系统在多场景下的问答准确率。 3. 负责系统可观测性与评测体系建设,包括自动化评测集构建、Bad Case 归因分析、A/B Test 机制设计与落地,推动算法能力的数据驱动迭代。 4. 参与记忆管理与自进化模块的研发,包括词表/规范/技能的自动提取、注入与版本管理,实现系统从用户反馈中持续学习的能力。 5. 跟踪业界前沿技术(RAG、Agent、多模态检索、LLM 推理优化等),将新技术快速验证并落地到产品中。