通义通义实验室-技术专家-向量检索

社招全职3年以上技术类-开发2026-03-26地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1、计算机或相关专业本科及以上学历，有后端/基础架构开发经验；
2、掌握C++/Go/Python语言中的一种或多种，具备良好的工程素养和代码规范意识；
3、有云原生技术栈实践经验（如 Kubernetes、Docker、Prometheus 等）；
4、具备线上服务 SRE 意识，熟悉日志、监控…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

我们正在寻找一位后台研发工程师，加入我们的核心基础设施团队，负责支撑公司云原生向量检索服务的开发、运维与稳定性保障。该服务作为智能搜索、RAG（Retrieval-Augmented Generation）等关键业务的核心组件，承载着高并发、低延迟、高可用的线上查询需求。你将参与以下工作：
1、负责向量检索服务后端功能模块的设计、开发与持续优化；
2、保障线上服务的稳定性、可扩展性与可观测性，快速响应并修复线上问题；
3、与算法、产品及前端团队紧密协作，高效落地面向RAG、智能搜索等场景的功能需求；
4、参与服务的云原生架构演进，包括容器化部署、弹性扩缩容、服务治理、监控告警等；
5、持续提升系统性能与资源利用效率，在保证准确性的前提下优化检索延迟与吞吐能力；

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

DevOps+

Linux+

分布式系统+

Kubernetes+

Docker+

Prometheus+

Grafana+

ELK+

OpenTelemetry+

Python+

Go+

还有更多 •••

登录查看完整学习资料

相关职位

蚂蚁集团-搜索开发技术专家（大模型应用）-数字医疗

社招3年以上技术类-开发

1、前瞻性地探索面向AI Native应用的新型AI搜索系统架构设计，构建高可靠性、高性能、高可扩展性的系统，并推动落地； 2、负责AI搜索架构研发，包括生成式搜索、多模态搜索等，基于百亿级大规模数据和大模型技术推进搜索关键技术攻关； 3、负责网页、图片、视频、文档等全网索引数据收录、理解、建库及索引架构设计，构建高时效、高质量、高可用的索引数据架构体系； 4、面向多场景应用，推进搜索平台化建设，提升迭代效率。

更新于 2025-07-09上海|杭州

通义实验室-技术专家-搜索增强(RAG)

社招5年以上技术类-开发

1、结合LLM技术，设计和优化RAG全链路的基础架构，提升系统的吞吐能力和响应速度； 2、构建高性能，可扩展的分布式文件处理和索引构建系统，承载海量文档的知识库的索引和检索需求； 3、规划和优化检索集群，通过合理的分片，资源分配等策略降低延迟提高吞吐，针对业务场景进行服务优化； 4、建立完善的系统监控，日志分析和trace平台，能快速定位和解决系统问题。

更新于 2025-09-16北京|杭州

通义实验室-技术专家-知识库搜索增强(RAG)

社招5年以上技术类-开发

通义实验室工程团队致力于打造面向公众与企业的大规模、高性能在线 AI 服务平台，支撑了通义千问、通义万相及多种开源先进模型的在线服务，并推动 AI Agents、多模态应用、MCP 等前沿技术的产品化落地。团队持续攻克异构 GPU 资源调度、多模型多地域部署、多模态任务统一推理、多样化服务等级保障（SLO），以及模型推理全链路工程化的关键挑战，不断提升资源效能和系统的性能、稳定性。 1、结合LLM技术，设计和优化RAG全链路的基础架构，提升系统的吞吐能力和响应速度； 2、构建高性能，可扩展的分布式文件处理和索引构建系统，承载海量文档的知识库的索引和检索需求； 3、规划和优化检索集群，通过合理的分片，资源分配等策略降低延迟提高吞吐，针对业务场景进行服务优化； 4、建立完善的系统监控，日志分析和trace平台，能快速定位和解决系统问题。

更新于 2025-12-10北京|杭州

AI Business-AI Search 工程技术专家-杭州

社招5年以上技术类-开发

阿里国际内部集大模型研究及智能化前沿产品研发于一体的AI部门；自研面向跨境商贸增强的多语言大模型-Marco和多模态大模型-Ovis，依托全球化的AI基础设施和算力资源，帮助AliExpress、Lazada、阿里巴巴国际站、Trendyol、Daraz 等平台全面革新跨境电商全链路的经营体验和商业效率；目前已服务超50万商家，平均日调用量已突破10亿次，覆盖营销、客户服务、商品发布、设计、合规等60+应用场景；正在基于自研的大模型与工程技术，打造新一代的智能体（Agent）和智能引擎（Deep Research）产品，持续致力于让全球商业没有语言障碍，用智能帮助跨境贸易更加简单。该职位负责构建高性能、可扩展的搜索引擎工程架构，优化搜索效果，支持多模态搜索能力，打造行业领先的搜索产品；工作职责 1、负责搜索引擎相关系统研发，打造高性能、低成本、多场景的搜索产品 2、设计并实现搜索系统分布式架构，确保系统的高可用性、高性能和可扩展性 3、构建支持多模态（文本、图像、视频）检索的搜索系统架构，推动多模态搜索能力落地 4、负责搜索服务端的开发工作，优化索引构建、查询处理等核心环节 5、与算法团队紧密协作，将搜索算法能力高效集成到工程系统中，实现搜索效果持续优化 6、构建搜索效果评估体系，设计A/B测试框架，通过数据驱动方式持续提升搜索质量 7、保障搜索系统的稳定性与性能，解决高并发、大规模数据处理等工程挑战，支撑复杂业务场景

更新于 2025-12-01杭州