携程AI后端开发专家(MJ030171)
任职要求
有算法平台开发或与算法团队深度合作经验,特别是模型部署、模型在线推理服务的实际项目经验。具备大语言模型或复杂模型在线部署(Triton, TorchServe, TensorFlow Serving)、性能调优和推理加速的实际项目经验。具备智能Agent系统核心模块(如知识库/RAG/记忆管理/工具调用)的设计或开发经验,熟悉相关框架(LangChain/LlamaIndex/MCP/A2A协议)和向量数据库。…
工作职责
负责大规模语言模型(LLM)及其他AI模型的在线服务部署、性能调优与推理加速,确保高并发、低延迟、高可用的模型服务。负责设计和开发智能Agent运行框架,实现核心模块,包括不限于知识库存储与检索(RAG)、Agent的长短期记忆存储、对接多模型协作协议(如MCP/A2A)等新型交互机制。探索和落地模型压缩、量化、动态批处理、服务化框架优化(Triton/TorchServe等)等推理优化技术。负责搜索推荐算法工程后端系统的设计、开发和维护,保障系统稳定高效运行,实现高并发在线特征工程、模型推理服务集成和服务质量监控等核心模块。负责系统架构的设计、优化及核心模块的代码实现(Java为主)。与产品经理、算法工程师、前端工程师紧密协作,理解需求,设计技术方案并推动落地。负责系统的日常维护、监控、故障排查和性能调优。
负责大规模语言模型(LLM)及其他AI模型的在线服务部署、性能调优与推理加速,确保高并发、低延迟、高可用的模型服务。负责设计和开发智能Agent运行框架,实现核心模块,包括不限于知识库存储与检索(RAG)、Agent的长短期记忆存储、对接多模型协作协议(如MCP/A2A)等新型交互机制。探索和落地模型压缩、量化、动态批处理、服务化框架优化(Triton/TorchServe等)等推理优化技术。负责搜索推荐算法工程后端系统的设计、开发和维护,保障系统稳定高效运行,实现高并发在线特征工程、模型推理服务集成和服务质量监控等核心模块。负责系统架构的设计、优化及核心模块的代码实现(Java为主)。与产品经理、算法工程师、前端工程师紧密协作,理解需求,设计技术方案并推动落地。负责系统的日常维护、监控、故障排查和性能调优。
参与新一代AI原生开发平台的整体架构设计与演进,确保系统具备卓越的性能、高可用性与灵活的可扩展性,为平台的长期发展奠定坚实的技术基石。 参与构建统一的AI基础设施平台,为通义灵码、AI Builder,以及前沿的Compute Use Agent等多个AI产品线提供坚实的技术底座。通过沉淀和抽象通用的模型服务、RAG组件、Agent框架等核心能力,从根源上解决重复建设与技术孤岛问题。 作为技术核心,负责攻克系统中的关键技术难题和性能瓶颈,并对团队成员进行技术指导,分享最佳实践,提升团队整体的AI工程能力和技术水平。 持续关注AI领域的前沿技术动态(如LLMs、多模态、Agent等),并能结合业务场景进行前瞻性思考,将创新技术驱动产品和架构的革新。
1.负责电商B端场景基于AI的核心功能开发与优化,包括但不限于商家智能助手、商达撮合AI推荐、投广智能诊断、商机挖掘与牵引等,构建适配电商场景的Agent、Multi-Agent应用和工具,用好AI技术持续提升商家经营效率和体验; 2.负责各技术节点的调优,包括但不限于知识库建设、RAG、Planning、LLM训练、稳定性/SLA等; 3.负责将业界前沿AI技术应用到产品中,推动业务效果非线性&规模化提升; 4.具备数据分析思维和手段,通过科学的数据分析为产品、技术迭代提供决策依据。
团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户;此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、深度依托AI技术驱动,主导并全方位把控大型分布式系统的架构设计、高复杂度的系统研发以及多环境的高效部署,从系统的宏观架构到细节实现,确保技术方案的先进性、可靠性与高扩展性,满足业务快速增长的需求; 2、牵头研发高复用性、高性能的基础服务组件,深入洞察业务中的共性需求,通过技术创新与优化,实现基础服务组件的标准化、模块化,有效减少重复开发与运维成本,提升整体研发效率,为业务的快速迭代提供坚实的技术支撑; 3、全面负责生产系统的日常维护与长期稳定运行,快速定位并解决生产系统中的各类疑难问题,同时对系统进行持续性能调优,保障系统在高并发、大数据量等复杂场景下的高效稳定运行; 4、参与技术团队的规划与选型,为团队引入前沿技术理念和工具,推动团队技术水平的整体提升。