logo of tongyi

通义通义实验室-大模型应用后端工程师(LLM Application Backend Engineer)-北京/杭州

社招全职2年以上技术类-开发地点:杭州状态:招聘

任职要求


1、硕士及以上学历,计算机相关专业,2年以上后端开发经验。
2、熟练掌握Go / Python / Java等至少一门后端语言;熟悉微服务架构设计分布式系统。
3、大模型相关经验:有 LLM应用开发经验;熟悉Context Engineering;熟悉 RAG 架构与向量数据库;熟悉主流大模型 API使用与优化(满足其中任意2项即可)。
4、熟悉 Re…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、大模型应用系统架构设计:设计并实现大模型应用整体后端架构(API 层、编排层、Agent 层、工具层);构建 LLM + RAG + Tool Calling + Workflow  的服务框架;构建稳定可复用的大模型调用封装层。
2、Agent 与工作流系统开发:构建可扩展的 Agent 执行框架(ReAct / Planner-Executor / Multi-Agent);设计工具调用协议(MCP、Tool Schema、Function Calling);支持复杂任务拆解、状态管理、上下文管理、长短期记忆管理。
3、RAG 与知识系统建设:构建知识索引与向量检索系统;设计高性能 embedding + 向量数据库架构;优化召回准确率、时效性与成本效率。
4、高并发与稳定性保障:构建支持高并发请求的大模型服务网关,优化模型调用延迟与成本,设计缓存机制,保障 SLA、容灾、限流、熔断。
5、多模态与实时系统支持:支持文本、语音、图像、多模态模型接口;支持流式输出(Streaming);构建实时交互系统(如 AI 助手 / AI 手机)。
包括英文材料
学历+
后端开发+
Go+
Python+
Java+
微服务+
系统设计+
分布式系统+
大模型+
还有更多 •••
相关职位

logo of kuaishou
社招D13917

针对快手大语言/多模态大模型的不同应用需求: 1、知识库构建与RAG应用:收集整理业务领域的核心信息,构建高效的知识库,开发并优化RAG应用,提升模型对特定领域知识的理解与生成能力; 2 、Prompt工程:针对不同的产品需求调优Prompt,确保LLM回答的可靠性和准确性; 3、Agent系统研发:研究并探索ReAct Agent和Multi Agent在复杂业务场景下的协作机制与智能决策; 4、效果监控与迭代:实施长期的实验计划,定期评估智能体性能,持续优化策略确保系统的稳定运行。

更新于 2025-07-17北京
logo of bytedance
社招A71211

1、业务应用:负责将自研的算法模型应用于企业协同软件中,在会议、文档、消息、办公智能体等诸多办公场景中打造优秀的AI工具和产品,不断改善用户体验; 2、模型优化:负责训练大语言模型不断提高其在办公领域的算法质量;建设高效的评测方法和技术体系;采集、调研并生产办公领域的高质量数据集; 3、技术建设:持续关注业界最新的技术趋势和研究成果,分享行业最佳实践,将前沿技术应用于大模型中。

更新于 2024-11-20上海
logo of bytedance
社招A204001

1、业务应用:负责将自研的算法模型应用于企业协同软件中,在会议、文档、消息、办公智能体等诸多办公场景中打造最好的AI工具和产品,不断改善用户体验; 2、模型优化:负责训练大语言模型不断提高其在办公领域的算法质量;建设高效的评测方法和技术体系;采集、调研并生产办公领域的高质量数据集; 3、技术建设:持续关注业界最新的技术趋势和研究成果,分享行业最佳实践,将前沿技术应用于大模型中。

更新于 2024-11-20深圳
logo of pinduoduo
社招2年以上技术类

1、负责后端系统架构设计、开发与优化,支撑业务平台发展; 2、推动算法模型的工程化落地,包括服务化封装与部署、性能优化等,内部完成产品化闭环; 3、参与大模型相关后端基础设施的搭建与优化,如推理服务、向量检索、Agent工作流引擎等。

更新于 2026-03-23上海