
地平线【地瓜机器人】大模型推理与部署实习生(VLA/具身智能方向)
任职要求
1、计算机、人工智能或相关专业在读硕士(优秀本科生可放宽),可连续实习6个月及以上; 2、熟悉Python,具备良好的工程代码习惯,具备Linux开发经验,熟悉常用命令与调试工具(如shell、日志分析、性能监控等); 3、熟悉PyTorch等深度学习框架,理解LLM/VLM的基本结构与推理流程; 4、具备实验与工程调试能力,能够定位性能瓶颈并进行问题分析。…
工作职责
1、参与VLA模型在仿真环境中的部署与运行,支持数据采集、任务执行与结果统计; 2、参与LLM/VLM/VLA模型的工程化训练与推理流程搭建,支持模型在不同配置下的运行与评测; 3、参与模型压缩、量化、推理加速等工程优化工作,对不同方案进行实验验证与性能对比; 4、配合完成模型部署相关的脚本、工具与文档,提升整体工程稳定性与可复现性。

1、性能分析与对齐:配合编译器团队,跟踪模型在特定硬件上的推理延迟,定位并辅助解决因编译器版本更迭导致的性能异常; 2、自动化评测工具开发:参与构建端侧模型性能/精度自动化评测系统,实现从模型转换、数据回推到端侧部署指标分析的全流程闭环; 3、前沿算法实验:追踪并复现业界主流量化算法(如 GPTQ, AWQ, SmoothQuant 等),验证其在特定芯片架构上的适配性与加速效果; 4、量化精度对齐与攻关:负责大语言模型(LLM)及多模态模型(VLM)在端侧平台的量化实验,涵盖 W8A8、W4 等主流方案,分析并解决 PTQ/QAT 过程中的精度掉点问题。

负责机器人领域端侧大模型的研发和应用,研判大模型未来发展趋势为后续芯片NPU规划提供输入。主要工作方向包括: 1. 探索LLM、VLM、VLA大模型在端侧性能与精度极限 2. 跟进与判断大模型发展趋势为后续芯片NPU规划提供输入

- 负责公司核心 SaaS 控制台的前端研发与迭代 - 基于 React + TypeScript + Vite 搭建多租户控制台、可视化配置页、实时数据 Dashboard。 - 设计并维护可复用的组件库及前端工程化体系(Monorepo、自动发布、单测/CI)。 - 承担轻量后端(BFF)开发 - 使用 Node.js(NestJS)或 Go(Gin/Fiber)编写聚合层,对接算法推理、任务调度、权限、计费等微服务。 - 保证前端到后端的数据链路高可用:接口聚合、缓存、降级、错误兜底。 - 算法业务前端接入与体验优化 - 将算法同学提供的推理/训练接口(RESTful / gRPC / SSE)在前端封装为可复用 hooks 或服务层,统一处理鉴权、重试、异常提示。 - 针对长耗时任务(CV 批处理、LLM 生成)设计「进度条 + 实时日志 + 结果预览」的交互闭环,支持断点续传、轮询/ WebSocket 推送。 - 持续优化 - 性能:SSR/CSR 混合、懒加载、前端缓存、资源压缩。 - 体验:全局错误边界、骨架屏、快捷键、无障碍支持。