极飞科技技术支持工程师(J10951)
任职要求
1.航空、自动化、电子相关专业本科以上学历;
2.熟悉飞控、GPS、惯导、电…工作职责
1.产品技术支持,为海外分销商提供远程及现场技术支持,快速诊断并解决产品软硬件问题。 2.推动产品优化与质量改进,系统化收集、分析海外市场产品故障数据及客户反馈,提炼核心问题并输出技术报告,协同研发、质量部门推动设计改进,提升产品国际适应性。 3.分销商技术能力建设,通过技术赋能提升分销商的维修及客户服务能力,定期组织全球技术沙龙,建立技术知识分享会。 4.技术文档与知识库管理,主导技术文档的编写,搭建全球案例知识库,实现技术经验跨区域复用。 5.完成上级安排的其他工作任务。

1、项目交付:负责机器人及弱电项目的成功交付,涵盖地图扫描、点位布局、机器人设备配置与调试等关键环节。 2、试运行与陪产支持:主导项目试运行阶段的工作,以及陪产期间的技术支持,迅速响应并解决试运行或陪产中遇到的各种问题,确保系统稳定、可靠运行。 3、施工组织设计:根据公司项目管理标准,编写施工方案,确保施工过程的科学性与规范性,按时提交项目相关文档,为项目管理提供坚实的信息支撑。 4、项目总结:参与项目总结与复盘工作,提炼项目过程中的成功经验与不足之处,为组织过程资产的积累与持续改进贡献力量,促进团队整体能力的提升。
1.可靠性计划制定与风险分析。依据产品或项目要求,制定全面的可靠性计划,明确目标、任务、流程和时间节点,主导或指导开展 FTA、FMEA 等可靠性风险分析工作; 2.可靠性指标分配与设计评审。将系统级可靠性指标合理分配到各子系统、零部件和组件;参与产品设计过程,进行可靠性评审,从可靠性角度提出改进建议,优化设计,降低风险; 3.运用预测方法和模型,对产品在不同工作条件下的可靠性进行预测; 4.设计并搭建可靠性试验体系,建立定性、定量可靠性增长、可靠性鉴定评价体系;参与产品各阶段方案及样机评审,把控可靠性设计风险; 5.可靠性数据分析与改进。基于可靠性数据分析结果,识别产品可靠性的薄弱环节和潜在问题,提出针对性改进措施,推动产品质量和可靠性持续提升; 6.识别、评估和监控项目中影响可靠性的风险,制定应对措施,解决可靠性相关问题;提供可靠性技术培训和指导,在产品出现可靠性问题时提供技术支持和解决方案; 7.完成上级安排的其他工作任务。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。
【业务介绍】 作为公司统一的机器学习平台团队,负责调度公司所有模型训练与推理资源;基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。 【岗位职责】 1、负责机器学习链路,离在线数据相关的开发工作,包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作;包括样本平台,特征平台,训练平台,推理平台等AI应用后台建设等; 3、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。