字节跳动大模型算法专家/工程师-代码质量方向
任职要求
1、在大型业务有大模型技术实际应用; 2、具备出色的编程、数据结构和算法技能,熟练掌握Go/C/C++或Python编程语言,在ACM/ICPC、NOI/IOI、Top Coder、Kag…
工作职责
1、推动大模型在代码质量提升方向的核心技术建设,持续优化大模型代码理解、推理与生成能力; 2、致力于提升大模型在真实生产环境的落地应用,包括但不限于单测生成、CodeReview、风险识别和修复等领域,最终提升业务的研发效率和代码质量。
1、推动大模型在代码质量提升方向的核心技术建设,持续优化大模型代码理解、推理与生成能力; 2、致力于提升大模型在真实生产环境的落地应用,包括但不限于单测生成、CodeReview、风险识别和修复等领域,最终提升业务的研发效率和代码质量。
1、负责 Coding 大模型能力优化,包括 Prompt、SFT、RL、RAG、Agent 等方案设计与落地; 2、提升模型在代码补全、代码生成、代码解释、Bug 修复、单测生成、Code Review 等场景中的效果; 3、构建代码数据、偏好数据和评测集,建立面向真实研发任务的评估体系; 4、与工程团队协作,优化模型训练、推理和部署效率,推动能力在 IDE、代码平台、研发流程中的落地; 5、建立业务效果闭环,持续跟踪模型上线后的采纳率、提效收益和研发质量提升情况。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、探索研发针对大语言模型、多模态大模型、StableDiffusion模型等模型的压缩技术,包括但不限于量化、蒸馏、剪枝、稀疏化等; 2、参与/负责多个业务场景中的模型压缩技术实现,对模型进行轻量化压缩,提高训练/推理效率,支持业务降本增效; 3、参与/负责针对英伟达GPU、华为昇腾NPU等不同的计算硬件,制定不同的模型压缩方案并在业务落地;
【我们是谁】 你将加入阿里千问C端事业群的核心算法团队,直接负责 千问、夸克AI问答 等大模型产品背后至关重要的“大脑”—— RAG(检索增强生成)系统。我们的使命是为大模型打造一个专属的、下一代搜索引擎,确保AI在回答用户问题时,能做到响应快速、内容全面、信息时效性强且高度专业。 作为算法组内的工程中坚力量,你将负责高性能检索系统的架构设计与核心代码实现(以C++为主),是一个有意从工程转算法的理想岗位。 1. 构建极速引擎:负责RAG检索链路的工程落地,面对海量并发请求,通过极致的代码优化和架构设计,保障系统的高吞吐与低延迟。 2. 算法工程化落地:与算法专家紧密配合,将前沿的向量检索、倒排索引、重排等算法策略转化为稳定、高效的线上工程服务。 3. 系统架构升级:针对AI问答场景的特殊性(如长文本处理、实时索引更新),打造具备高可用、高扩展性的分布式后端服务体系,支撑未来AI搜索形态的快速演进。