logo of ctrip

携程AI后端开发专家(MJ030206)

社招全职旅游业务开发地点:上海状态:招聘

任职要求


算法平台开发或与算法团队深度合作经验,特别是模型部署、模型在线推理服务的实际项目经验。具备大语言模型或复杂模型在线部署(Triton, TorchServe, TensorFlow Serving)、性能调优和推理加速的实际项目经验。具备智能Agent系统核心模块(如知识库/RAG/记忆管理/工具调用)的设计或开发经验,熟悉相关框架(LangChain/LlamaIndex/MCP/A2A协议)和向量数据库。负责过C端高并发系统的设计、开发和稳定性保障。具备架构设计能力、抽象能力和平台化落地经验,有成功主导或深度参与中大型平台项目的证明,具备独立负责和推动复杂技术项目从设计到上线的全流程能力。精通Java后端开发语言,具备深厚的编程功底和面向对象编程思想,熟练使用MySQLOracle等关系型数据库,具备数据库设计、优化和故障排查能力,熟悉实时数据处理技术栈,如FlinkKafka等,有实时数据处理任务实战经验。

工作职责


负责大规模语言模型(LLM)及其他AI模型的在线服务部署、性能调优与推理加速,确保高并发、低延迟、高可用的模型服务。负责设计和开发智能Agent运行框架,实现核心模块,包括不限于知识库存储与检索(RAG)、Agent的长短期记忆存储、对接多模型协作协议(如MCP/A2A)等新型交互机制。探索和落地模型压缩、量化、动态批处理、服务化框架优化(Triton/TorchServe等)等推理优化技术。负责搜索推荐算法工程后端系统的设计、开发和维护,保障系统稳定高效运行,实现高并发在线特征工程、模型推理服务集成和服务质量监控等核心模块。负责系统架构的设计、优化及核心模块的代码实现(Java为主)。与产品经理、算法工程师、前端工程师紧密协作,理解需求,设计技术方案并推动落地。负责系统的日常维护、监控、故障排查和性能调优。
包括英文材料
算法+
TensorFlow+
性能调优+
AI agent+
RAG+
LangChain+
LlamaIndex+
MCP+
高并发+
系统设计+
Java+
后端开发+
MySQL+
Oracle+
Kafka+
相关职位

logo of ctrip
社招旅游业务开发

负责大规模语言模型(LLM)及其他AI模型的在线服务部署、性能调优与推理加速,确保高并发、低延迟、高可用的模型服务。负责设计和开发智能Agent运行框架,实现核心模块,包括不限于知识库存储与检索(RAG)、Agent的长短期记忆存储、对接多模型协作协议(如MCP/A2A)等新型交互机制。探索和落地模型压缩、量化、动态批处理、服务化框架优化(Triton/TorchServe等)等推理优化技术。负责搜索推荐算法工程后端系统的设计、开发和维护,保障系统稳定高效运行,实现高并发在线特征工程、模型推理服务集成和服务质量监控等核心模块。负责系统架构的设计、优化及核心模块的代码实现(Java为主)。与产品经理、算法工程师、前端工程师紧密协作,理解需求,设计技术方案并推动落地。负责系统的日常维护、监控、故障排查和性能调优。

更新于 2025-08-26
logo of xiaohongshu
社招3-5年后端开发

1、重点参与小红书核心业务 - 交易类笔记场域的建设,完成相关业务的高质量迭代交付; 2、建设发布&消费能力、笔记投流、选品等底层基础能力,给到商家C端消费侧核心诉求洞察,提高优质供给的发布量; 3、探索达人笔记带货业务,构建分销中台的底层能力以及商家&达人的线上化撮合系统; 4、持续探索小红书场景下的货柜电商打法,参与商城首页和相关频道的业务迭代建设; 5、构建高可用、易扩展的微服务体系,对业务架构提出建设性优化建设。

更新于 2025-09-11
logo of xiaohongshu
社招3-5年后端开发

1. 负责千帆联盟核心系统(含分销商家管理、分销商品路径优化、商达撮合、佣金结算等模块)的技术架构设计、研发及持续演进。 2. 推动AI技术在千帆联盟业务场景(含分销托管、商达撮合等)的应用落地。 3. 深入理解千帆联盟核心业务逻辑(分销、达人/主播/买手生态、撮合、结算),协同产品经理规划业务蓝图与技术路线。 4. 对所负责系统模块进行持续设计与优化,提升扩展性与稳定性,协调跨职能协作,推动项目交付。

更新于 2025-09-22
logo of bytedance
社招3年以上A246111

团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户;此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、深度依托AI技术驱动,主导并全方位把控大型分布式系统的架构设计、高复杂度的系统研发以及多环境的高效部署,从系统的宏观架构到细节实现,确保技术方案的先进性、可靠性与高扩展性,满足业务快速增长的需求; 2、牵头研发高复用性、高性能的基础服务组件,深入洞察业务中的共性需求,通过技术创新与优化,实现基础服务组件的标准化、模块化,有效减少重复开发与运维成本,提升整体研发效率,为业务的快速迭代提供坚实的技术支撑; 3、全面负责生产系统的日常维护与长期稳定运行,快速定位并解决生产系统中的各类疑难问题,同时对系统进行持续性能调优,保障系统在高并发、大数据量等复杂场景下的高效稳定运行; 4、参与技术团队的规划与选型,为团队引入前沿技术理念和工具,推动团队技术水平的整体提升。

更新于 2025-02-26