快手大模型后端工程-可灵
任职要求
1、本科及以上学历,计算机相关专业; 2、3 年及以上 Java 开发经验,有扎实的计算机基础知识和编程功底,熟悉面向对象设计,有大规模分布式系统的设计和开发经验; 3、精通多线程编程,熟悉JVM,熟悉常见的开源分布式中间件、缓存、消息队列、数据库等; 4、有强烈的…
工作职责
1、负责AIGC类产品研发工作,协同产品、算法实现AIGC产品开发及业务落地; 2、理解业务逻辑与产品需求,设计和实现高可用技术方案,满足高并发、海量数据的挑战,持续改进提升系统性能,降低推理硬件成本; 3、围绕AIGC算法研发,建设高效率的AI模型迭代平台,包括数据标注与管理、模型训练、自动评测和部署,等全流程的工具平台建设。
1、负责可灵数字人团队生成端系统,包括技术方案设计、算法对接服务部署、业务方对接工作; 2、负责可灵数据团队内部文本及多模态大模型的推理部署效率优化需求。
1、配合算法同学,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统; 2、优化大模型推理服务性能,提升吞吐并控制成本; 3、优化大模型推理服务化框架,提升框架易用性和可调试性。
【关于我们】 Hi Lab 是小红书核心AI 实验室,点点作为新一代生活场景AI搜索助手,依托海量小红书笔记 + 全网真实经验 + 深度思考大模型能力(DeepSeek等),为用户提供“精准避坑、超级实用、有画面感”的美食、旅行、购物、穿搭、生活答案。 支持多模态提问(文字/语音/拍照)、视频化回复、多轮追问,正在快速迭代成为年轻人日常的“生活搭子”。 加入Hi Lab,你将直接参与千万级DAU AI对话产品的服务端核心建设,与顶尖算法/客户端团队一起,打造高并发、高可靠的AI交互基础设施,推动AI真正懂生活、懂小红书! 【岗位职责】 - 负责点点AI对话产品服务端核心架构设计与开发,覆盖多轮对话流、用户体系、账号体系及第三方能力集成; - 设计并实现高可用对话分发与消息路由系统,支持千万级并发访问与长连接管理; - 构建用户画像、Memory上下文与个性化记忆体系,提升多轮交互的智能与连贯性; - 对接搜索、RAG、点评、电商等第三方能力,打造灵活、可扩展的工具调用与Function Call链路; - 建设全链路稳定性与容灾体系,推动Trace、Metrics、Logging、OpenTelemetry、多地多活等可观测性与高可用能力落地; - 参与容量规划、压测优化、性能调优与持续可观测建设,确保系统在高峰期丝滑稳定; - 驱动工程效率提升,包括CI/CD自动化、服务治理、云原生实践(K8s/Istio),保障线上SLA。 1、负责 AI 对话产品服务端核心架构设计与开发,涵盖对话流、用户体系、账号与三方能力等模块; 2、设计并实现高可用的对话分发与消息路由系统,支撑千万级并发访问; 3、构建用户画像与 Memory 管理体系,支持上下文增强与个性化记忆; 4、对接第三方能力(搜索、点评、电商等),构建灵活可扩展的工具调用体系; 5、建设全链路稳定性与容灾体系,推进 Trace / Metrics / Logging / 多地多活能力落地; 6、参与系统容量规划、压测优化与持续可观测性建设; 7、推动工程效率、CI/CD 与服务质量提升,保障线上可用性。
你将与一群“可能是行业内最顶尖的”Java后端工程师一起,共同搭建业界领先的直播平台。在这里你将: 1、参与快手直播营收系统的研发工作,深入发掘和分析业务需求,撰写技术方案和系统设计,通过敏捷开发支持产品需求快速迭代,支撑业务规模增长; 2、接受高并发、海量资金以及数据的挑战,分析和发现系统的优化点,负责推动系统易用、扩展、可用性、资金安全性、性能等提升; 3、参与直播营收业务与AI技术的深度融合,并结合业务具体场景给出工业化落地方案,提高直播流水; 4、探索AI领域最新的技术和趋势,为团队引入创新的技术、创新的解决方案,用创新的思路解决问题。