logo of tongyi

通义通义实验室-技术专家-搜索增强(RAG)

社招全职5年以上技术类-开发地点:北京 | 杭州状态:招聘

任职要求


1、计算机/人工智能相关专业硕士及以上学历,5年以上工作经验,精通C++/Java/Go一门编程技术, 有大型分布式系统开发经验者优先;
2、熟悉信息检索理论,具有高并发在线服务系统开发经验者优先;
3、熟悉Linux系统脚本, 能够熟练使用Unix shell scripting…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、结合LLM技术,设计和优化RAG全链路的基础架构,提升系统的吞吐能力和响应速度;
2、构建高性能,可扩展的分布式文件处理和索引构建系统,承载海量文档的知识库的索引和检索需求;
3、规划和优化检索集群,通过合理的分片,资源分配等策略降低延迟提高吞吐,针对业务场景进行服务优化;
4、建立完善的系统监控,日志分析和trace平台,能快速定位和解决系统问题。
包括英文材料
学历+
C+++
Java+
Go+
分布式系统+
信息检索+
高并发+
Linux+
还有更多 •••
相关职位

logo of tongyi
社招5年以上技术类-开发

通义实验室工程团队致力于打造面向公众与企业的大规模、高性能在线 AI 服务平台,支撑了通义千问、通义万相及多种开源先进模型的在线服务,并推动 AI Agents、多模态应用、MCP 等前沿技术的产品化落地。团队持续攻克异构 GPU 资源调度、多模型多地域部署、多模态任务统一推理、多样化服务等级保障(SLO),以及模型推理全链路工程化的关键挑战,不断提升资源效能和系统的性能、稳定性。 1、结合LLM技术,设计和优化RAG全链路的基础架构,提升系统的吞吐能力和响应速度; 2、构建高性能,可扩展的分布式文件处理和索引构建系统,承载海量文档的知识库的索引和检索需求; 3、规划和优化检索集群,通过合理的分片,资源分配等策略降低延迟提高吞吐,针对业务场景进行服务优化; 4、建立完善的系统监控,日志分析和trace平台,能快速定位和解决系统问题。

更新于 2025-12-10北京|杭州
logo of amap
社招5年以上技术类-开发

1、参与搜索、推荐、广告等引擎各个功能模块的设计和实现,构建高可靠性、高可用性、高可扩展性的引擎系统,满足日趋复杂的业务需求; 2、参与大模型在高德各个用户场景中的应用开发和落地。 2、参与产品的开发和维护,完成从需求到设计、开发和上线等整个项目周期内的工作;

更新于 2025-11-18北京
logo of amap
社招技术类-开发

1、参与搜索、推荐、广告等引擎各个功能模块的设计和实现,构建高可靠性、高可用性、高可扩展性的引擎系统,满足日趋复杂的业务需求; 2、参与大模型在高德各个用户场景中的应用开发和落地。 2、参与产品的开发和维护,完成从需求到设计、开发和上线等整个项目周期内的工作;

更新于 2025-06-18北京
logo of xiaohongshu
社招5-10年后端开发

【关于我们】 点点是小红书新一代生活场景AI搜索助手,依托DeepSeek大模型 + 小红书海量真实笔记 + 全网经验,为用户提供“精准避坑、超级实用、有画面感”的美食、旅行、购物、穿搭、生活答案。支持多模态提问(文字/语音/拍照)、视频化回复、多轮追问,已形成独立App、微信小程序 + 小红书站内“问点点”全域布局。 “用增方向”(用户增长)是点点的核心战略引擎,当前重点通过外部流量平台投放(抖音、快手、B站、微博、小红书生态外渠道、搜索广告等)驱动新用户获取、激活与留存,实现DAU快速规模化增长。我们正在构建高效的投放增长闭环:从创意素材生成、投放策略优化、实时效果监控,到用户全链路转化漏斗优化,推动点点成为年轻人日常必备的“生活搜索神器”。 我们期待对内外部流量投放增长有深度实战、对AI产品冷启动与规模化增长敏感、对数据驱动决策有极致追求的资深后端同学,一起把点点从“有用”做到“让人上瘾、规模爆发”! 【岗位职责】 1、负责点点内外部流量投放增长系统的核心架构设计与开发,包括投放数据实时采集、策略引擎、预算分配、创意分发、A/B实验平台、转化归因链路等; 2、构建高并发、低延迟的投放决策与监控服务,支持日均亿级曝光、千万级点击的实时个性化投放与动态调优; 3、设计并实现跨平台投放统一中台,打通抖音、快手、B站、微博、搜索广告(百度/字节/腾讯系)等多渠道数据与投放接口,实现统一调度、预算智能分配、ROI实时优化; 4、建设增长实验平台与效果分析体系,支持快速测试投放创意、落地页、渠道策略、用户分层等,驱动新用户获取成本持续下降、激活/留存率显著提升; 5、与算法(推荐/召回/创意生成)、客户端、数据、运营团队深度协作,推动外部流量 → App/小程序激活 → 多轮交互 → 留存的闭环增长; 6、优化系统性能、稳定性与成本控制,支撑高峰期QPS与低延迟,确保投放链路99.99%可用性; 7、参与增长基础设施建设(如实时特征平台、埋点治理、归因模型、反作弊体系等),赋能投放增长效率翻倍。

更新于 2026-01-15上海|北京