
商汤大装置-资深存储系统开发工程师
任职要求
1、计算机或相关专业,五年以上开发工作经验,本科及以上学历,熟悉计算机体系结构, 理解硬件的工作原理; 2、有扎实的 C/C++ 或者 Rust 编程功底 3、有多进程、线程和异步编程经验,算法与数据结构知识扎实; 4、…
工作职责
1、负责分布式存储系统的架构设计和研发工作。 2、软硬结合聚焦低延时、高性能、高性价比的分布式存储技术。 3、跟踪业界趋势,调研分析存储学术界的新技术用业界前沿技术。 4、将负责大装置EB级分布式存储服务平台,海量元数据分布式管理系统的架构设计、开发。

1.负责公有云AI IaaS 产品的规划和落地,主要负责AI算力池产品设计; 2.积极与客户沟通,深入探索基于云原生产品架构下的推理、训练产品能力建设; 3.熟悉各类GPU在训练推理细分场景的优劣势,能针对不同用户场景,拉通研发团队给与针对性优化建议 4.产品PRD设计基本功扎实,重视用户体验;

本岗位参与当地的就业见习计划(为期3个月),欢迎2025届、2026届的同学投递。 见习期间会通过技术培训(包含线下/线上培训及考核),就近区域项目实践,提升相关的专业知识和技能。 见习期间签署当地政府认可的见习协议,通过见习考核的有机会转正。 1. 客户支持与需求挖掘:在资深同事的指导下,协助进行客户沟通,准确理解客户需求,学习并参与制定差异化的解决方案。 2. 技术方案支持:协助整理和撰写项目方案、技术文档及演示材料,清晰传递技术概念,支持销售与技术团队的协同工作。 3. 市场与行业研究:参与对特定ToB行业业务场景的调研与分析,学习将云计算技术与行业需求相结合,为产品优化和市场策略提供支持。 4. 项目执行与跟进:协助跟踪项目进展,参与项目会议,确保项目信息在团队内部的高效流转与同步。 5. 技术学习与实践:积极参与公司组织的技术培训,学习并探索AI技术在商业场景中的应用。

1、品牌传播:负责技术品牌形象的树立与维护,将核心技术亮点提炼为具有冲击力的品牌信息(Message house)和传播语言; 2、内容创作:创作适用于不同渠道(官微、媒体等)的高质量内容,包括新闻稿、深度文章、案例研究、视频脚本、产品画册等; 3、媒体合作:拓展并维护与主流科技媒体、创投类媒体、垂直行业媒体(如机器人、科研机构等)及顶级学术/科研媒体的长期、深度合作关系。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。