logo of tongyi

通义通义实验室-技术专家-向量检索

社招全职3年以上技术类-开发地点:北京 | 杭州状态:招聘

任职要求


1、计算机或相关专业本科及以上学历,有后端/基础架构开发经验;
2、掌握C++/Go/Python语言中的一种或多种,具备良好的工程素养和代码规范意识;
3、有云原生技术栈实践经验(如 KubernetesDockerPrometheus 等);
4、具备线上服务 SRE 意识,熟悉日志、监控…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


我们正在寻找一位后台研发工程师,加入我们的核心基础设施团队,负责支撑公司云原生向量检索服务的开发、运维与稳定性保障。该服务作为智能搜索、RAG(Retrieval-Augmented Generation)等关键业务的核心组件,承载着高并发、低延迟、高可用的线上查询需求。你将参与以下工作:
1、负责向量检索服务后端功能模块的设计、开发与持续优化;
2、保障线上服务的稳定性、可扩展性与可观测性,快速响应并修复线上问题;
3、与算法、产品及前端团队紧密协作,高效落地面向RAG、智能搜索等场景的功能需求;
4、参与服务的云原生架构演进,包括容器化部署、弹性扩缩容、服务治理、监控告警等;
5、持续提升系统性能与资源利用效率,在保证准确性的前提下优化检索延迟与吞吐能力;
包括英文材料
DevOps+
Linux+
分布式系统+
Kubernetes+
Docker+
Prometheus+
Grafana+
ELK+
OpenTelemetry+
Python+
Go+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术类-开发

1、前瞻性地探索面向AI Native应用的新型AI搜索系统架构设计,构建高可靠性、高性能、高可扩展性的系统,并推动落地; 2、负责AI搜索架构研发,包括生成式搜索、多模态搜索等,基于百亿级大规模数据和大模型技术推进搜索关键技术攻关; 3、负责网页、图片、视频、文档等全网索引数据收录、理解、建库及索引架构设计,构建高时效、高质量、高可用的索引数据架构体系; 4、面向多场景应用,推进搜索平台化建设,提升迭代效率。

更新于 2025-07-09上海|杭州
logo of tongyi
社招5年以上技术类-开发

1、结合LLM技术,设计和优化RAG全链路的基础架构,提升系统的吞吐能力和响应速度; 2、构建高性能,可扩展的分布式文件处理和索引构建系统,承载海量文档的知识库的索引和检索需求; 3、规划和优化检索集群,通过合理的分片,资源分配等策略降低延迟提高吞吐,针对业务场景进行服务优化; 4、建立完善的系统监控,日志分析和trace平台,能快速定位和解决系统问题。

更新于 2025-09-16北京|杭州
logo of tongyi
社招5年以上技术类-开发

通义实验室工程团队致力于打造面向公众与企业的大规模、高性能在线 AI 服务平台,支撑了通义千问、通义万相及多种开源先进模型的在线服务,并推动 AI Agents、多模态应用、MCP 等前沿技术的产品化落地。团队持续攻克异构 GPU 资源调度、多模型多地域部署、多模态任务统一推理、多样化服务等级保障(SLO),以及模型推理全链路工程化的关键挑战,不断提升资源效能和系统的性能、稳定性。 1、结合LLM技术,设计和优化RAG全链路的基础架构,提升系统的吞吐能力和响应速度; 2、构建高性能,可扩展的分布式文件处理和索引构建系统,承载海量文档的知识库的索引和检索需求; 3、规划和优化检索集群,通过合理的分片,资源分配等策略降低延迟提高吞吐,针对业务场景进行服务优化; 4、建立完善的系统监控,日志分析和trace平台,能快速定位和解决系统问题。

更新于 2025-12-10北京|杭州
logo of alibaba
社招5年以上技术类-开发

阿里国际内部集大模型研究及智能化前沿产品研发于一体的AI部门;自研面向跨境商贸增强的多语言大模型-Marco和多模态大模型-Ovis,依托全球化的AI基础设施和算力资源,帮助AliExpress、Lazada、阿里巴巴国际站、Trendyol、Daraz 等平台全面革新跨境电商全链路的经营体验和商业效率;目前已服务超50万商家,平均日调用量已突破10亿次,覆盖营销、客户服务、商品发布、设计、合规等60+应用场景;正在基于自研的大模型与工程技术,打造新一代的智能体(Agent)和智能引擎(Deep Research)产品,持续致力于让全球商业没有语言障碍,用智能帮助跨境贸易更加简单。 该职位负责构建高性能、可扩展的搜索引擎工程架构,优化搜索效果,支持多模态搜索能力,打造行业领先的搜索产品; 工作职责 1、负责搜索引擎相关系统研发,打造高性能、低成本、多场景的搜索产品 2、设计并实现搜索系统分布式架构,确保系统的高可用性、高性能和可扩展性 3、构建支持多模态(文本、图像、视频)检索的搜索系统架构,推动多模态搜索能力落地 4、负责搜索服务端的开发工作,优化索引构建、查询处理等核心环节 5、与算法团队紧密协作,将搜索算法能力高效集成到工程系统中,实现搜索效果持续优化 6、构建搜索效果评估体系,设计A/B测试框架,通过数据驱动方式持续提升搜索质量 7、保障搜索系统的稳定性与性能,解决高并发、大规模数据处理等工程挑战,支撑复杂业务场景

更新于 2025-12-01杭州