通义通义实验室-技术专家-搜索增强(RAG)
任职要求
1、计算机/人工智能相关专业硕士及以上学历,5年以上工作经验,精通C++/Java/Go一门编程技术, 有大型分布式系统开发经验者优先; 2、熟悉信息检索理论,具有高并发在线服务系统开发经验者优先; 3、熟悉Linux系统脚本, 能够熟练使用Unix shell scripting…
工作职责
1、结合LLM技术,设计和优化RAG全链路的基础架构,提升系统的吞吐能力和响应速度; 2、构建高性能,可扩展的分布式文件处理和索引构建系统,承载海量文档的知识库的索引和检索需求; 3、规划和优化检索集群,通过合理的分片,资源分配等策略降低延迟提高吞吐,针对业务场景进行服务优化; 4、建立完善的系统监控,日志分析和trace平台,能快速定位和解决系统问题。
通义实验室工程团队致力于打造面向公众与企业的大规模、高性能在线 AI 服务平台,支撑了通义千问、通义万相及多种开源先进模型的在线服务,并推动 AI Agents、多模态应用、MCP 等前沿技术的产品化落地。团队持续攻克异构 GPU 资源调度、多模型多地域部署、多模态任务统一推理、多样化服务等级保障(SLO),以及模型推理全链路工程化的关键挑战,不断提升资源效能和系统的性能、稳定性。 1、结合LLM技术,设计和优化RAG全链路的基础架构,提升系统的吞吐能力和响应速度; 2、构建高性能,可扩展的分布式文件处理和索引构建系统,承载海量文档的知识库的索引和检索需求; 3、规划和优化检索集群,通过合理的分片,资源分配等策略降低延迟提高吞吐,针对业务场景进行服务优化; 4、建立完善的系统监控,日志分析和trace平台,能快速定位和解决系统问题。
1、参与搜索、推荐、广告等引擎各个功能模块的设计和实现,构建高可靠性、高可用性、高可扩展性的引擎系统,满足日趋复杂的业务需求; 2、参与大模型在高德各个用户场景中的应用开发和落地。 2、参与产品的开发和维护,完成从需求到设计、开发和上线等整个项目周期内的工作;
1、参与搜索、推荐、广告等引擎各个功能模块的设计和实现,构建高可靠性、高可用性、高可扩展性的引擎系统,满足日趋复杂的业务需求; 2、参与大模型在高德各个用户场景中的应用开发和落地。 2、参与产品的开发和维护,完成从需求到设计、开发和上线等整个项目周期内的工作;
负责大模型Large Language Model(LLM)技术在云计算服务领域多个业务场景落地的核心技术攻坚,尤其是阿里云服务领域的数字员工的建设和落地,以及阿里云智能客服大模型对话机器人、智能辅助Copilot、服务体验等场景的大模型落地,提升内外部用户的服务效率和服务体验。 岗位职责包括但不限于: 1. 负责基于通用基座大模型(通义千问等)结合领域数据构建云计算服务领域大模型,包括大模型落地业务场景识别、数据清洗/构造,LLM训练和调优,搜索增强RAG,LLM Agents等LLM关键技术方向攻坚 2. 探索基于大模型技术的服务新形态,包括多个场景的数字服务小二,,智能辅助Copilot等云计算服务新形态场景的大模型落地技术,打造云计算服务领域“大模型落地”的标杆 3. 深入阿里云服务内外部业务场景,结合大模型技术、搜索推荐、多模态等算法模型能力解决云服务领域实际业务痛点,并参与规划和设计未来云服务领域的大模型技术演进规划和落地