logo of hello

哈啰研发平台工程师

社招全职软研类地点:上海 | 北京状态:招聘

任职要求


必备技能
● 熟悉 K8s Operator / CRD 开发
● 熟悉 JupyterLab / …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


● 设计与维护多租户 Notebook / IDE 环境
● 优化镜像启动与依赖注入流程
● 实现 GPU / CPU 资源隔离与管控
● 提供实验可追溯能力与审计支持
包括英文材料
Kubernetes+
还有更多 •••
相关职位

logo of antgroup
社招2年以上技术类-前端

● 参与和负责蚂蚁图计算相关的产品前端研发,为蚂蚁一线业务提供稳定好用的图研发和分析产品; ● 参与蚂蚁智能化商业洞察产品的建设,通过数据可视化等前端技术助力用户从数据到洞见; ● 参与蚂蚁用户行为分析产品建设,从规范到 SDK 到分析全链路闭环建设; ● 参与蚂蚁数据研发平台产品建设,了解业内复杂数据体系下数仓建设,并通过 AI 改变数据探查与研发模式; ● 参与产品体验度量产品建设,从 0-1 定义蚂蚁自己的产品度量体系,帮助产品提升体验; ● 探索未来,结合业务产品 和 AI 的新创意

更新于 2025-08-26北京
logo of meituan
实习核心本地商业-业

1. 负责饮食健康相关的小助手开发; 2. 负责机器学习平台离线系统的平台开发和运维。 3. 持续优化系统,提升系统性能表现以及算力规模,不断提高链路的时效性和稳定性; 4. 结合产品和业务的需求,持续改善搜索推荐用户体验,提升业务指标。

更新于 2025-05-13北京
logo of antgroup
社招3年以上技术-开发

1、负责或参与到蚂蚁离线研发平台和运维调度系统的建设。 2、负责或参与SQL编码Agent或者数据研发Agent的建设。 3、负责或参与到蚂蚁的数据集成平台和SQL取数平台的建设。

更新于 2025-08-28杭州
logo of xiaohongshu
社招5-10年引擎

我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。

更新于 2026-03-28上海|北京