字节跳动AI Infra Agent后端开发工程师-计算
任职要求
1、扎实的计算机知识,有较强的逻辑能力和学习能力,深入了解Go、Python、Java等至少一门语言; 2、有AI Agent系统开发经验,熟悉LLM、RAG、LangChain/LangGraph/A…
工作职责
1、负责IaaS AI Agent套件研发工作,构建稳定可靠的Agent Infra,涵盖Agent相关云服务基础能力开发,探索技术创新,助力 AI 原生能力规模化实施; 2、参与AI Agent开发套件以及相关产品研发工作,降低个人开发者/企业客户使用Agent技术门槛; 3、能够与产品和业务团队紧密协作,识别业务场景需求/痛点并优化解决,同时迭代架构设计; 4、参与并迭代Agent链路与模型的评估体系,通过Prompt Engineering、SFT、RL等算法提升Agent能力上限; 5、跟进AI Agent生态的技术发展,推进新技术的引入与实施,持续保持技术的先进性与领先性。
我们正在寻找有经验的 AI 基建开发工程师,负责构建企业级 AI 基础设施,包括 AIGW(AI Gateway / 大模型接入与运维)、智能 NPC 平台、MCP Hub 等关键 AI 基础设施的设计、开发和运维工作。您将参与大模型接入、能力编排、性能优化、评估体系建设以及成本管理等全链路工作,帮助业务更高效地使用大模型。 您将与 AI 应用、业务研发、平台团队紧密协作,构建稳定、高性能、可扩展的大模型服务体系。 主要职责: 1. 负责 AIGW(AI Gateway)的大模型接入、路由、限流、监控、运维体系建设与优化。 2. 实现并维护与主流大模型服务(OpenAI、Anthropic、Gemini、DeepSeek 等)的 API 集成体系。 3. 参与大模型能力评估:效果评测、推理性能优化、模型选型对比、成本分析与优化。 4. 构建并维护 LLM 应用相关的工具链,包括 Prompt 模板管理、RAG 访问层、评测框架。 5. 优化模型调用策略(缓存、多模型路由、降级策略、并发调度)。 6. 支持业务团队落地 AI 应用,协助完成模型选型、评估、接入、调试与规范化接入。 7. 编写并维护平台技术文档、接入文档、最佳实践与标准。 8. 持续跟进生成式 AI、大模型推理、Agent/MCP、模型加速等领域的最新进展并应用于平台。
1. 主导新一代训练与推理引擎的架构设计与核心模块开发,支撑搜广推业务在长序列建模、生成式推荐、Agent 等前沿场景的规模落地。 2. 与存储、数据平台深度协同,打造端到端 ML 数据 Pipeline:统一特征管理、秒级调试、版本追踪与一键上线,让数据科学家专注模型创新。 3. 持续优化训推基础设施:自研 Embedding 高速存储、特征 DSL 引擎、弹性调度与服务化推理框架,实现 10x 级性能提升。 4. 跟踪 LLM / Agent 最新进展,将其工程化落地到搜索、广告、推荐及智能体业务,定义行业新标准。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责字节跳动机器学习平台的开发,支撑公司相关业务的算法生产与高效迭代; 2、设计和实现机器学习相关的基础设施、框架、工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责字节跳动机器学习平台的开发,支撑公司相关业务的算法生产与高效迭代; 2、设计和实现机器学习相关的基础设施、框架、工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。