字节跳动AI Infra Agent后端开发工程师-计算

社招全职A1771262025-09-12地点：北京状态：招聘

扫码手机上打开

任职要求

1、扎实的计算机知识，有较强的逻辑能力和学习能力，深入了解Go、Python、Java等至少一门语言；
2、有AI Agent系统开发经验，熟悉LLM、RAG、LangChain/LangGraph/A…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责IaaS AI Agent套件研发工作，构建稳定可靠的Agent Infra，涵盖Agent相关云服务基础能力开发，探索技术创新，助力 AI 原生能力规模化实施；
2、参与AI Agent开发套件以及相关产品研发工作，降低个人开发者/企业客户使用Agent技术门槛；
3、能够与产品和业务团队紧密协作，识别业务场景需求/痛点并优化解决，同时迭代架构设计；
4、参与并迭代Agent链路与模型的评估体系，通过Prompt Engineering、SFT、RL等算法提升Agent能力上限；
5、跟进AI Agent生态的技术发展，推进新技术的引入与实施，持续保持技术的先进性与领先性。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

Go+

Python+

Java+

AI agent+

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

深度学习推理优化工程师-引擎架构

社招3年以上后端开发

【岗位职责】 1. 主导新一代训练与推理引擎的架构设计与核心模块开发，支撑搜广推业务在长序列建模、生成式推荐、Agent 等前沿场景的规模落地。 2. 与存储、数据平台深度协同，打造端到端 ML 数据 Pipeline：统一特征管理、秒级调试、版本追踪与一键上线，让数据科学家专注模型创新。 3. 持续优化训推基础设施：自研 Embedding 高速存储、特征 DSL 引擎、弹性调度与服务化推理框架，实现 10x 级性能提升。 4. 跟踪 LLM / Agent 最新进展，将其工程化落地到搜索、广告、推荐及智能体业务，定义行业新标准。

更新于 2026-04-02北京|上海

大装置-智算平台Web前端开发工程师

社招3年以上Web前端开发

参与商汤大装置智能云的核心 Web 产品研发，包括： · 云控制台（算力/云服务/AI Infra） · AI 中台（大模型、数据、训练/推理平台） · 智能运营平台、官网等关键 B 端产品我们会根据你的经验与意愿匹配具体方向。岗位职责： 1. 负责大装置控制台、AI 中台、运营平台等 Web 应用的前端开发与架构优化。 2. 深度参与产品需求讨论，与产品、后端、设计团队紧密协作，推动功能迭代与用户体验提升。 3. 独立完成前端开发工作。 4. 优化系统性能、前端工程化体系和可观察性，提升整体开发效率与用户体验。 5. 参与前端组件、微前端架构及工程工具链的建设与持续优化。

更新于 2025-12-11北京|深圳

【2026校招】深度学习推理优化工程师

校招引擎

1. 主导新一代训练与推理引擎的架构设计与核心模块开发，支撑搜广推业务在长序列建模、生成式推荐、Agent 等前沿场景的规模落地。 2. 与存储、数据平台深度协同，打造端到端 ML 数据 Pipeline：统一特征管理、秒级调试、版本追踪与一键上线，让数据科学家专注模型创新。 3. 持续优化训推基础设施：自研 Embedding 高速存储、特征 DSL 引擎、弹性调度与服务化推理框架，实现 10x 级性能提升。 4. 跟踪 LLM / Agent 最新进展，将其工程化落地到搜索、广告、推荐及智能体业务，定义行业新标准。

更新于 2025-09-04北京|上海

AI 平台工程师（AI Infra / AI Platform Engineer）

社招3年以下网易游戏（互娱）

我们正在寻找有经验的 AI 基建开发工程师，负责构建企业级 AI 基础设施，包括 AIGW（AI Gateway / 大模型接入与运维）、智能 NPC 平台、MCP Hub 等关键 AI 基础设施的设计、开发和运维工作。您将参与大模型接入、能力编排、性能优化、评估体系建设以及成本管理等全链路工作，帮助业务更高效地使用大模型。您将与 AI 应用、业务研发、平台团队紧密协作，构建稳定、高性能、可扩展的大模型服务体系。主要职责： 1. 负责 AIGW（AI Gateway）的大模型接入、路由、限流、监控、运维体系建设与优化。 2. 实现并维护与主流大模型服务（OpenAI、Anthropic、Gemini、DeepSeek 等）的 API 集成体系。 3. 参与大模型能力评估：效果评测、推理性能优化、模型选型对比、成本分析与优化。 4. 构建并维护 LLM 应用相关的工具链，包括 Prompt 模板管理、RAG 访问层、评测框架。 5. 优化模型调用策略（缓存、多模型路由、降级策略、并发调度）。 6. 支持业务团队落地 AI 应用，协助完成模型选型、评估、接入、调试与规范化接入。 7. 编写并维护平台技术文档、接入文档、最佳实践与标准。 8. 持续跟进生成式 AI、大模型推理、Agent/MCP、模型加速等领域的最新进展并应用于平台。

更新于 2025-12-02广州