快手大模型后端工程-可灵
任职要求
1、本科及以上学历,计算机相关专业; 2、3 年及以上 Java 开发经验,有扎实的计算机基础知识和编程功底,熟悉面向对象设计,有大规模分布式系统的设计和开发经验; 3、精通多线程编程,熟悉JVM,熟悉常见的开源分布式中间件、缓存、消息队列、数据库等; 4、有强烈的…
工作职责
1、负责AIGC类产品研发工作,协同产品、算法实现AIGC产品开发及业务落地; 2、理解业务逻辑与产品需求,设计和实现高可用技术方案,满足高并发、海量数据的挑战,持续改进提升系统性能,降低推理硬件成本; 3、围绕AIGC算法研发,建设高效率的AI模型迭代平台,包括数据标注与管理、模型训练、自动评测和部署,等全流程的工具平台建设。
【关于我们】 Hi Lab 是小红书核心AI 实验室,点点作为新一代生活场景AI搜索助手,依托海量小红书笔记 + 全网真实经验 + 深度思考大模型能力(DeepSeek等),为用户提供“精准避坑、超级实用、有画面感”的美食、旅行、购物、穿搭、生活答案。 支持多模态提问(文字/语音/拍照)、视频化回复、多轮追问,正在快速迭代成为年轻人日常的“生活搭子”。 加入Hi Lab,你将直接参与千万级DAU AI对话产品的服务端核心建设,与顶尖算法/客户端团队一起,打造高并发、高可靠的AI交互基础设施,推动AI真正懂生活、懂小红书! 【岗位职责】 - 负责点点AI对话产品服务端核心架构设计与开发,覆盖多轮对话流、用户体系、账号体系及第三方能力集成; - 设计并实现高可用对话分发与消息路由系统,支持千万级并发访问与长连接管理; - 构建用户画像、Memory上下文与个性化记忆体系,提升多轮交互的智能与连贯性; - 对接搜索、RAG、点评、电商等第三方能力,打造灵活、可扩展的工具调用与Function Call链路; - 建设全链路稳定性与容灾体系,推动Trace、Metrics、Logging、OpenTelemetry、多地多活等可观测性与高可用能力落地; - 参与容量规划、压测优化、性能调优与持续可观测建设,确保系统在高峰期丝滑稳定; - 驱动工程效率提升,包括CI/CD自动化、服务治理、云原生实践(K8s/Istio),保障线上SLA。 1、负责 AI 对话产品服务端核心架构设计与开发,涵盖对话流、用户体系、账号与三方能力等模块; 2、设计并实现高可用的对话分发与消息路由系统,支撑千万级并发访问; 3、构建用户画像与 Memory 管理体系,支持上下文增强与个性化记忆; 4、对接第三方能力(搜索、点评、电商等),构建灵活可扩展的工具调用体系; 5、建设全链路稳定性与容灾体系,推进 Trace / Metrics / Logging / 多地多活能力落地; 6、参与系统容量规划、压测优化与持续可观测性建设; 7、推动工程效率、CI/CD 与服务质量提升,保障线上可用性。
通义团队聚焦AIGC、大模型基础研究和行业应用探索,领域覆盖视觉、语音、自然语言处理、机器学习等多个领域。在这里你可以接触业界领先的AI产品和技术,深度参与Modelscope开源生态平台、DashScop灵积模型服务平台、通义AI产品的建设,探索AI+不同场景的全新交互形式,打造具有科技感、全新生产力的科技型产品。 期待您的加入,AI浪头一起弄潮,感受不一样的未来! 1. 负责AI大模型相关系统设计、开发和上线等整个项目周期内的工作。 2. 负责系统技术规划和技术前瞻布局,解决系统疑难问题。 3. 构建高可靠性、高可用性、高可扩展性的体系结构,满足日趋复杂的业务需求。
作为团队成员,致力于使用前沿技术实现卓越的大模型产品体验。将涉足大模型工程的多个关键领域,包括但不限于: 1、建设大语言模型相关工具和平台,包括大模型OpenAPI、插件、安全、评估试用、预训练、SFT等相关平台的后端研发工作,跨部门团队密切合作,共同推动大模型核心架构和生态系统的发展; 2、为各业务场景设计大语言模型方案,支持AI搜索、虚拟人、AIGC、RAG等业务场景。高效率高标准支持大模型产品高频迭代需求,能深入理解业务,可技术自驱赋能业务增长; 3、负责大模型在线的性能优化和稳定性保障工作,性能上可多视角来挖掘系统的性能瓶颈,不断挑战极限;稳定性上保障产品高SLA,同时对全系统做好降级保障; 4、设计高度可扩展工具、平台和解决方案,极大提高建设和部署效率,以支撑业务快速增长; 5、关注后端和大模型前沿技术,跟进业内最新研究进展和应用趋势,提出创新思路和方向。