沐瞳【2026届春招】业务运维工程师
任职要求
专业不限,计算机、软件工程、信息管理类优先,本科或以上学历; 熟悉linux操作系统,熟练使用各种linux日常命令,熟悉shell、python、golang等至少一种语言; 熟悉使用mysql数据库,熟悉日常的sql语句,能够对数据库进行管理、配置、部署; 了解zab…
工作职责
负责游戏业务的部署、新版本的发布、服务端的变更; 负责与游戏运营的日常沟通交流,接受并处理项目组提出的运维需求; 负责日常运维工作的自动化、工具化建设; 负责游戏业务运行状况监控,及时处理游戏运行中出现的故障,保证游戏服务的正常提供;

1.参与去哪儿全系列产品的研发与测试过程:产品需求,功能设计,产品可测性设计与反馈,单元测试,系统测试,性能测试,产品效果评估评测等多方面,全流程的保证产品质量; 2.参与构建去哪儿研发体系的持续集成环境构建及自动化测试平台的研发,构建和模拟线上大规模和分布式的多样化运维场景,参与产品线特色化的测试框架,测试工具研发; 3.参与去哪儿产品整个发布过程中的技术创新,在保证高质量交付的同时加速软件的发布周期,与业内优秀的项目流程管理人员一起,对去哪儿的核心产品的发布过程进行技术革新和流程优化,包括解决编译依赖,提升测试效率,开发创新的性能测试和监控工具来精确预估线上系统表现。

培养特色 1. 总经理亲授带教:由工作室总经理一对一 / 团队带教,深度参与项目研发、运营、团队管理全流程, 直击核心业务逻辑,快速积累实战经验。 2. 定制化培养路径:提供三大发展方向 ——游戏项目管理向、综合项目管理向、产品向,结合个人特 长与工作室需求定制成长方案。 1. 日常运营支持:组织协调工作室各类业务会议,负责会议纪要撰写、督办事项跟进与反馈;协助策划 并落地工作室团建、培训等活动;承担跨部门对接协调工作,保障信息高效流转。 2. 项目全流程实践:深度参与游戏项目研发 / 运营环节,从创意构思、需求拆解、开发推进到上线运 维,全面掌握游戏产品全生命周期运作模式与核心业务要点。 3. 项目进度与资料管理:跟进日常项目需求及进度,收集、整理、归档各类项目文档;定期分析项目进 展,输出项目情况汇报,主动识别问题并总结经验,提出合理化建议助力项目平稳推进。 4. 行业与竞品分析:持续关注游戏行业政策动态、市场趋势及玩家反馈,定期开展竞品调研与分析;完 成游戏体验评测报告,为工作室产品定位、功能优化、市场策略制定提供决策参考。 5. 专业能力提升:积极参与内部培训、行业分享会及学习活动,主动拓展游戏领域专业知识与技能,拓 宽行业视野,为职业发展夯实基础。
1、参与公司大数据平台架构的设计、优化与研发工作,涵盖 Spark、Hadoop、HBase、Iceberg 等核心组件 2、根据业务需求,设计高可用、高扩展性、高性能的大数据计算方案 3、参与 Iceberg 数据湖表的架构设计、规范制定与性能调优 4、参与 HBase 集群规划、表设计、预分区策略、热点优化及日常运维支持 5、参与 Spark 作业调优、资源管理与作业框架建设,提升整体计算稳定性与效率 6、配合团队进行 Hadoop 平台建设、集群管理、版本升级与安全策略落地 7、跟踪大数据技术前沿,结合业务场景进行技术预研和落地。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。