美团大模型应用高级工程师
任职要求
1.具备扎实的Java基础,熟悉多线程等基础技术,对多线程使用、并发处理、JVM基本原理有一定认识; 2.熟悉分布式系统的开发和性能优化,有高并发、大访问量的后台服务开发、系统调优经验者; 3.具有一定的技术规划和设计能力,能发现架构设计中存在的问题,并给出有效的解决措施和方法; 4.具备较强的学习能力、动手能力和问题分析及解决能力; 5.具备优秀的沟通能力和团队合作能力,有客户意识,能够与不同的团队进行快速高效的协作; 具备以下条件优先…
工作职责
1.主导公司级的AI Tools平台架构设计,构建工具注册、语义加工与权限管理体系,设计多业务场景里Agent对工具的高效调用和管理平台; 2.开发公司级Agent-Tools协同框架,设计Tools动态检索、执行隔离与上下文共享机制,解决多Agent协同作业时的工具准召提升,结合RAG优化、知识库融合等技能,提升Agent在高并发下的工具决策效率; 3.建设高可用工具服务中台,优化工具调用链路(压测/熔断/降级/流量调度),支撑十到百万级QPS的工具服务响应,保障复杂业务场景的并发可靠性; 4.推进跨团队技术协同,主导工具接入标准制定、开发者生态建设与业务方联动,通过统一协议实现Agent-工具-业务系统的高效对接,有高度的服务客户意识;
1、负责大模型应用的工程解决方案的设计与开发,推进大模型AI能力(LLM、VLM、MLLM等)在快手短视频、直播、电商等业务场景的快速落地; 2、理解业务逻辑与产品需求,设计和实现高可用技术方案、满足高并发、海量数据的挑战。持续改进提升系统性能和稳定性,降低推理硬件成本; 3、围绕大模型算法研发,建设高效率的AI模型迭代平台,包括数据标注与管理、模型训练、自动评测和部署,等全流程的工具平台建设。
1应用架构设计与演进:负责大模型应用开发平台(LLM App Platform)的整体架构设计,定义应用层与模型层的交互标准,构建支持Agent、RAG、工作流编排的高扩展性基础框架; 2核心引擎研发:主导核心中间件的研发,包括但不限于:模型网关(Model Gateway)、智能体运行时(Agent Runtime)、上下文状态管理及工具/插件注册中心**,屏蔽底层模型差异,降低业务接入成本; 3高可用与性能优化:解决大模型应用场景下的长链路超时、Token吞吐瓶颈等问题;设计并落地流式传输(Streaming)、语义缓存(Semantic Cache)、熔断降级等机制,保障系统在高并发下的稳定性与低延迟; 4工程化与效能工具:搭建Prompt管理、大模型评估(Eval)框架及调试回放系统,提升算法与业务团队的研发效率与迭代质量; 5稳定性建设:构建全链路可观测体系(Trace/Metric/Log),针对大模型特有的Token消耗、生成质量、耗时分布进行精细化监控与治理; 6技术攻坚与规划:跟踪LangChain、Semantic Kernel等开源社区动态,结合业务需求进行架构选型与预研,推动技术栈的持续升级。
1. 主导现有物流系统AI化升级的整体后端架构设计,结合业务场景制定技术选型方案(如微服务/云原生架构),规划大模型集成、Agent调度的分层架构,保障系统扩展性与兼容性。 有成功落地经验、个人作品者优先; 2. 设计企业知识库的分布式架构,基于Python/Java技术栈搭建多源数据接入层、向量检索层与服务封装层,解决高并发下的数据同步与检索性能问题,输出架构设计文档。 3. 负责AI Agent核心架构落地,设计多智能体协作框架(如基于事件驱动/服务调用模式),定义Agent通信协议与状态管理机制,规避系统耦合风险,保障架构稳定性。 4. 主导架构评审与技术难点攻关,定期评估AI化架构适配性,输出架构演进方案,协调跨团队资源推进落地,确保系统AI化升级符合业务长期发展需求。