字节跳动Agent技术研发工程师-基础设施
任职要求
1、熟练掌握Python/Go/Java等至少一门语言,有项目开发经验者优先; 2、对大模型有深入理解,熟悉LLM技术原理与应用方法,有Agent系统设计与实现经验;了解MCP、工具调用、Prompt Engine…
工作职责
1、负责火山引擎Agent应用治理的技术研发,包括MCP管理、Prompt动态配置、Agent安全控制等基础能力建设; 2、设计并实现易用高效的Agent开发套件,降低开发者使用Agent技术的门槛; 3、探索Agent方向的创新方法与技术,提出更先进的Agent范式,引领行业技术发展。
1. 参与 AgentRun 平台核心引擎的设计与开发,构建支持多框架(AgentScope/LangGraph/AutoGen/Dify/ADK 等)兼容的统一 Agent 运行时环境; 2. 负责高并发、低延迟的 Agent 执行调度系统研发,实现任务编排、状态管理、上下文隔离、资源限流与弹性扩缩容; 3. 设计并实现 Agent 工具调用(Tool Calling)的安全沙箱机制,支持 REST、Function Call、插件等多种集成模式,保障执行安全性与稳定性; 4. 构建面向 LLM Agent 的可观测体系,包括执行链路追踪、Token 消耗分析、失败重试策略、性能瓶颈诊断等,提升平台可运维性; 5. 深度参与 AgentRun 与通义大模型、阿里云 Serverless、函数计算(FC)、SLS 等基础设施的集成,打造端到端的智能体 PaaS 能力; 6. 探索前沿 Agent 技术(如反思机制、多智能体协作、长期记忆等)在生产环境中的工程化落地路径。
介绍: 淘系用户运营平台技术团队是AI驱动的智能增长引擎研发团队,专注于AI Agent核心技术研发,通过自主智能体(Agent)实现用户全生命周期的自动化、智能化运营。 我们构建了日均处理千亿级数据、支撑千万级QPS的人群运营基础设施平台,赋能阿里集团用户增长与业务创新。 团队深耕大模型与智能体技术的落地应用,崇尚技术极客精神,持续探索Agent在复杂业务场景中的突破性创新,诚邀具备AI Agent研发经验的业界人才加入,共同定义下一代智能用户运营系统。 职位描述: 1、负责AI Agent核心引擎研发,主导智能决策引擎、任务规划模块、工具调用框架、记忆管理机制等关键组件的开发,支撑用户画像分析、智能人群圈选等核心业务场景的自动化执行; 2、构建Agent实时数据感知与反馈闭环,基于Flink/Spark等框架优化数据处理链路,实现毫秒级用户行为响应与策略动态调整,强化Agent对实时业务环境的感知与适应能力; 3、复杂大规模人群服务系统的性能优化与稳定性保障,解决高并发场景下的请求调度、容错机制、状态一致性等技术挑战,确保系统在千万级QPS下的稳定运行与弹性扩展; 4、深入探索大模型与Agent的深度融合,参与用户运营领域大模型微调与持续优化Agent的推理能力、决策效率与交互体验,推动强化学习、多智能体协作等技术在用户增长场景的创新落地;
1、负责公司机器学习平台的开发,支撑公司相关业务的算法生产与高效迭代; 2、设计和实现机器学习相关的基础设施、框架、工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。
阿里云ApsaraMQ是行业一流的Serverless消息云服务,为客户提供一站式多场景的业界主流消息服务(包括Apache RocketMQ、Apache Kafka、RabbitMQ、MQTT、MNS、EventBridge),具备10倍成本优化、10倍弹性能力、异地多活、丰富集成生态等产品优势。目前AI时代已来,我们正在引领新一代AI MQ技术,为AI Agent提供事件驱动架构基础设施和实时AI Context服务,覆盖AI原生应用架构和一站式Agentic数据分析的场景。 1.负责阿里云消息云服务AI MQ、Data+AI等特性研发,拓展消息、事件流在AI场景的落地规模; 2.负责阿里云消息云服务稳定性建设,为AI Agent提供坚实、可靠的通信、数据流技术底座; 3.负责阿里云消息技术性能优化、成本优化,持续降低Agent通信的延迟和成本; 4.负责阿里云消息运维平台建设,基于大模型构建SRE Agent持续提升产研效率; 5.负责Apache RocketMQ技术竞争力建设和开源社区运营,打造AI MQ心智,持续扩大开发者规模。