小红书大模型研发工程师(质量研效)
任职要求
1、计算机相关专业本科及以上学历(含应届博士),有扎实的计算机基础知识和编程功底,良好的数据结构基础; 2、熟悉大语言模型(LLM)架构,有大语言模型应用开发经验,在智能问答、代码review、代码续写、测试用例生成等方向有成功经验; 3、至少掌握一门高级语言, 包括Java、Golang、C/C++、Python; 4、精通多线程编程,熟悉常见的开源分布式…
工作职责
1、参与大模型在公司质效领域的应用落地,包括使用开源模型或者API搭建大模型应用架构、评测体系建设、智能体建设、智能CR、智能问答、UI自动化、测试用例生成等; 2、学习跟踪业界大模型在效能领域的最新进展,并探索大模型在公司效能方向的机会点和提升改进落地效果;
1.负责腾讯元器、云智能体开发平台国际版后台服务架构设计、开发与维护工作; 2.负责后台系统的性能优化、稳定性、流程建设和研效提升; 3.参与RAG,工作流编排,AI 智能体等实际业务场落地; 4.开发者文档、SDK工具包及代码样例维护,协助第三方接入,合作伙伴产品的集成和交付工作。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、探索研发针对大语言模型、多模态大模型、StableDiffusion模型等模型的压缩技术,包括但不限于量化、蒸馏、剪枝、稀疏化等; 2、参与/负责多个业务场景中的模型压缩技术实现,对模型进行轻量化压缩,提高训练/推理效率,支持业务降本增效; 3、参与/负责针对英伟达GPU、华为昇腾NPU等不同的计算硬件,制定不同的模型压缩方案并在业务落地;
我们正在寻找一名资深CI/CD 系统开发专家,专注于 Hologres 实时数据仓库引擎的持续集成与持续交付系统的开发与优化。Hologres 是阿里巴巴自研的实时数据仓库引擎,支持海量数据的高并发、低延迟查询,广泛应用于实时数据分析、报表展示、BI 分析等场景。 你将参与构建和优化 Hologres 的自动化构建、测试、部署和发布系统,推动Hologres研发部署流程高效、稳定、可扩展。该岗位对系统架构、工程能力和技术深度有较高要求,适合有大型分布式系统 CI/CD 经验的高级工程师或架构师,或者有大数据系统研发经验的高级工程师。