logo of kuaishou

快手混合云AI推理工程师-【可灵AI专项】

社招全职3-5年J0011地点:北京状态:招聘

任职要求


1、本科及以上学历,计算机、软件工程、人工智能、自动化等相关专业优先;
2、3年以上机器学习系统或基础架构系统的设计和研发经验,熟练掌握 Java/go/Python 语言中的一种;
3、了解云厂商中间件服务,熟悉至少一种消息队列Kafka/RabbitMQ)、分布式缓存Redis)及云数据库;
4、熟悉主流公有云(AWS / 阿里云等)核心服务,具备高可用部署、监控(Promet…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、构建领先的全球化混合云异构AI推理集群,负责云端服务架构设计,基于云原生技术构建高可用、可扩展的大规模分布式AI推理系统;
2、选型与优化云中间件(消息队列、缓存、分布式数据库等),解决高并发、低延迟问题;
3、设计基于混合云的生产环境部署策略,保障多环境稳定运行,制定监控、灾备及扩容方案;
4、支持B端业务和C端业务多种商业模式的持续探索和落地,比如公有云部署、专有云部署、模型授权等工作;
5、建设面向全球化业务和混合云异构算力的智能分配和流量优先级调度系统,实现多国家、多租户、多场景下极致优化算力使用效率并提升业务收益。
包括英文材料
学历+
机器学习+
Java+
Go+
Python+
中间件+
消息队列+
Kafka+
RabbitMQ+
缓存+
Redis+
还有更多 •••
相关职位

logo of sensetime
社招3年以上系统开发

你将参与公司核心云平台的研发与演进,围绕 Kubernetes 云原生体系,构建支撑 AI 训练、推理及大规模集群运行的 平台级能力。 根据个人背景与兴趣,可在 OpenAPI平台、容器平台、智算资源调度、云监控/可观测性 等方向深入发展。 工作职责 1. 参与云平台核心系统的设计与开发,支撑多集群、多环境(公有云 / 私有云 / 混合云)运行。 2. 基于 Kubernetes 体系,参与集群管理、资源调度、配置管理等平台能力建设。 3. 根据方向不同,参与以下一项或多项工作: · 大模型推理 OpenAPI 平台方向:对接不同推理引擎与推理框架,建设标准化接入平台。 · 云原生平台方向:Kubernetes 平台能力开发与优化(集群管理、CI/CD、平台工具链)。 · 智算云方向:面向 AI 训练/推理的资源调度、K8s 扩展(scheduler/controller/operator)。 · 可观测性方向:云监控与可观测性平台建设(指标、日志、Tracing 数据链路)。 4. 与系统、网络、SRE 等团队协作,持续提升平台的稳定性、可扩展性与可运维性。 5. 在实际项目中参与关键模块设计与技术方案评审,并推动方案落地。

更新于 2026-05-27北京
logo of baidu
社招ACG

-负责建设业界领先的AI异构算力容器平台,提供高性能、高稳定性、高易用性的混合云产品,支持AIGC、智算中心、智驾、金融能源等客户AI应用高效部署 -负责云原生AI容器相关产品的架构设计和产品研发,引入开源社区先进的AI框架、AI调度、AI工作流和AI可观测能力组件构建全栈AI应用云原生解决方案 -结合 SOTA 模型训练推理优化原理,深入模型结构与设计思路,将训练推理优化手段工程实践化,为客户提供系统性加速方案,提升训推效率 -针对大规模异构集群场景下,探索训推任务管理、异构资源调度、虚拟化混布、容器存储、高性能网络、分布式训练和推理等技术的创新和应用 -探索业界最新技术方向,参与机器学习框架等开源社区,提升百度混合云AI核心竞争力,提升团队技术影响力

更新于 2025-04-09北京
logo of aliyun
社招10年以上云智能集团

岗位定位 我们正在寻找一位能定义下一代搜索体验的技术领军者。 您将全面负责企业级多模态AI搜索平台的技术与产品研发,打造集搜索、推荐、智能问答于一体的信息中枢。这个平台要解决的核心问题是:如何让用户跨越文档、图像、视频、数据库等多种信息形态,通过一次交互获得深度、精准、可推理的答案——无论信息散布在企业内部的哪个系统,还是来自外部网络。 这不是一个单纯的技术执行岗位。您将拥有从产品形态定义到技术架构决策的完整空间,带领团队从0到1打造对标行业标杆的智能搜索产品,并在核心业务场景中实现规模化商业价值。 核心职责 技术战略与架构设计 ● 制定多模态AI搜索平台的技术路线图,定义搜索、推荐、问答三位一体的产品技术架构与演进方向 ● 设计企业级多信息源协同搜索架构——将分散在文档库、数据库、IM、业务系统中的企业私有数据与公网信息安全融合,构建统一的语义检索与知识理解层 ● 主导端云协同AI搜索架构的设计:云端承载深度检索与推理,终端实现低延迟即时响应,二者无缝衔接形成一致的搜索体验 ● 攻克图像、视频、多模态文档等复杂内容的高效索引、智能切分与跨模态语义召回,建立行业领先的多模态检索能力 工程研发与算法创新 ● 领导搜索工程与算法策略团队,负责索引体系构建、召回策略优化与排序模型持续迭代 ● 推动大模型在搜索场景的深度应用——包括RAG架构优化、推理增强搜索(Deep Search)、AI Agent驱动的主动信息获取能力 ● 建立体系化的搜索效果评测与迭代机制,以准确率、满意度和业务转化为核心指标驱动持续优化 产品落地与商业化 ● 与产品、业务团队紧密协同,将平台技术能力转化为可交付、可规模化的搜索产品与解决方案 ● 负责技术方案在核心业务场景的商业化落地,对可量化的业务结果负责 ● 持续追踪企业搜索与多模态搜索的行业趋势,推动产品在竞争格局中建立差异化优势 组织建设与技术文化 ● 搭建高水平搜索技术团队,主导核心人才引进与梯队建设,制定工程师成长路径 ● 营造追求技术卓越、鼓励深度思考与开放协作的工程文化,建立技术评审与知识沉淀机制 ● 代表团队参与行业交流,在多模态搜索领域建立技术品牌影响力

更新于 2026-04-07杭州
logo of aligenie
社招10年以上

岗位定位 我们正在寻找一位能定义下一代搜索体验的技术领军者。 您将全面负责企业级多模态AI搜索平台的技术与产品研发,打造集搜索、推荐、智能问答于一体的信息中枢。这个平台要解决的核心问题是:如何让用户跨越文档、图像、视频、数据库等多种信息形态,通过一次交互获得深度、精准、可推理的答案——无论信息散布在企业内部的哪个系统,还是来自外部网络。 这不是一个单纯的技术执行岗位。您将拥有从产品形态定义到技术架构决策的完整空间,带领团队从0到1打造对标行业标杆的智能搜索产品,并在核心业务场景中实现规模化商业价值。 核心职责 技术战略与架构设计 ● 制定多模态AI搜索平台的技术路线图,定义搜索、推荐、问答三位一体的产品技术架构与演进方向 ● 设计企业级多信息源协同搜索架构——将分散在文档库、数据库、IM、业务系统中的企业私有数据与公网信息安全融合,构建统一的语义检索与知识理解层 ● 主导端云协同AI搜索架构的设计:云端承载深度检索与推理,终端实现低延迟即时响应,二者无缝衔接形成一致的搜索体验 ● 攻克图像、视频、多模态文档等复杂内容的高效索引、智能切分与跨模态语义召回,建立行业领先的多模态检索能力 工程研发与算法创新 ● 领导搜索工程与算法策略团队,负责索引体系构建、召回策略优化与排序模型持续迭代 ● 推动大模型在搜索场景的深度应用——包括RAG架构优化、推理增强搜索(Deep Search)、AI Agent驱动的主动信息获取能力 ● 建立体系化的搜索效果评测与迭代机制,以准确率、满意度和业务转化为核心指标驱动持续优化 产品落地与商业化 ● 与产品、业务团队紧密协同,将平台技术能力转化为可交付、可规模化的搜索产品与解决方案 ● 负责技术方案在核心业务场景的商业化落地,对可量化的业务结果负责 ● 持续追踪企业搜索与多模态搜索的行业趋势,推动产品在竞争格局中建立差异化优势 组织建设与技术文化 ● 搭建高水平搜索技术团队,主导核心人才引进与梯队建设,制定工程师成长路径 ● 营造追求技术卓越、鼓励深度思考与开放协作的工程文化,建立技术评审与知识沉淀机制 ● 代表团队参与行业交流,在多模态搜索领域建立技术品牌影响力

更新于 2026-04-07杭州