
哈啰【英才2026】AI infra工程师-软件研发中心-上海/杭州
社招全职算法地点:杭州 | 上海状态:招聘
任职要求
熟悉大模型Agent、RAG应用开发,熟悉LangChain、LlamaIndex等…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
负责AI平台、大模型平台及AI应用平台相关系统的设计与开发,聚焦智能Agent、RAG等前沿AI能力的工程化落地; 1. 涵盖机器学习系统模型训练、模型推理、资源管理、工作流、模型评估、数据处理、监控告警等功能模块开发; 2. 负责多种异构资源如GPU、CPU、RDMA等的最优化的编排调度,提升集群的整体资源利用率; 3. 解决开发过程中遇到的技术难题,确保项目按时交付; 4. 与算法团队密切合作,负责机器学习、深度学习算法模型的工程化、服务化以及产品化; 5. 负责平台的性能优化和稳定性保障,监控系统运行状态,及时发现和解决潜在的问题。 6. 大模型推理性能优化。
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
AI agent+
https://www.ibm.com/think/ai-agents
Your one-stop resource for gaining in-depth knowledge and hands-on applications of AI agents.
RAG+
https://www.youtube.com/watch?v=sVcwVQRHIc8
Learn how to implement RAG (Retrieval Augmented Generation) from scratch, straight from a LangChain software engineer.
还有更多 •••
相关职位

社招算法
1. 基于 Java / Python 语言开发 Agent 核心功能,包括但不限于任务拆解、工具集成、状态管理等模块; 2. 调试并优化 Agent 与大模型的交互链路,提升响应速度与任务完成准确率; 3. 参与技术方案讨论,输出技术文档,推动研发流程规范化; 4. 主动调研行业内优秀的 Agent 框架(如 LangChain、AutoGPT 等)及大模型能力,提炼可复用的技术经验; 5. 协助解决开发过程中的技术问题,参与代码评审,保障代码质量。
更新于 2025-11-04杭州

社招软研类
岗位亮点: • 参与万卡超算集群、多云、多集群环境的 AI 平台研发,支持大规模模型训练与推理任务。 • 接触前沿技术:GPU/AI 加速、分布式训练、云原生调度、容器化、分布式存储。 • 学习机会丰富,可快速成长为训练/推理、调度或资产管理方向的核心研发工程师。 • 参与超算平台核心模块研发与优化,包括训练、推理、作业调度及 AI 资产管理。 • 学习并实践高性能计算、分布式系统和大规模数据处理技术。 • 支持平台稳定运行,协助性能调优和多集群资源管理。 • 与团队紧密协作,快速迭代产品和技术方案。
更新于 2025-12-11北京|上海