字节跳动大模型算法专家/工程师-代码质量方向
任职要求
1、在大型业务有大模型技术实际应用; 2、具备出色的编程、数据结构和算法技能,熟练掌握Go/C/C++或Python编程语言,在ACM/ICPC、NOI/IOI、Top Coder、Kag…
工作职责
1、推动大模型在代码质量提升方向的核心技术建设,持续优化大模型代码理解、推理与生成能力; 2、致力于提升大模型在真实生产环境的落地应用,包括但不限于单测生成、CodeReview、风险识别和修复等领域,最终提升业务的研发效率和代码质量。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、探索研发针对大语言模型、多模态大模型、StableDiffusion模型等模型的压缩技术,包括但不限于量化、蒸馏、剪枝、稀疏化等; 2、参与/负责多个业务场景中的模型压缩技术实现,对模型进行轻量化压缩,提高训练/推理效率,支持业务降本增效; 3、参与/负责针对英伟达GPU、华为昇腾NPU等不同的计算硬件,制定不同的模型压缩方案并在业务落地;
1、负责AI算法的质量保障工作,负责算法效果的测试框架和测试标准的搭建; 2、分析业务产品需求、技术方案,负责测试方案的设计,制定合理高效的测试方案; 3、AI测试体系建设,构建AI原子能力、大语言模型、多模态感知、AIGC等算法的评测模型; 4、与产品经理、开发工程师、算法工程师等密切协作,参与产品的需求评审、设计评审与代码审查等环节,提前介入产品开发过程,提供测试视角的意见与建议,促进产品质量的前置保障。 5、编写详细、准确的测试报告,向项目团队、管理层及相关利益者汇报测试进展、发现的问题、质量状况及改进建议,确保各方对产品质量有清晰、全面的了解与认识
1、推动大模型在代码质量提升方向的核心技术建设,持续优化大模型代码理解、推理与生成能力; 2、致力于提升大模型在真实生产环境的落地应用,包括但不限于单测生成、CodeReview、风险识别和修复等领域,最终提升业务的研发效率和代码质量。
团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1)探索最前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2)探索跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3)探索大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4)探索千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务,方方面面都进行深入研究和创新。 1、参与搜索引擎研发,探索搜索全链路(分析、召回、粗排、精排、混排)的个性化行为建模,包括CTR、CVR预估、向量召回、价值混排、RAG、NLP、LLM、多模态、机器学习、深度学习等,推动搜索算法在国际化电商场景的落地与提升,提升亿级用户搜索体验; 2、参与国际化电商搜索算法的优化与迭代,提升转化效率、用户体验和供给生态;解决多语言相关性匹配、权威性感知、种草内容理解、重复铺货、山寨假货治理等技术难题,极致优化内容电商、传统货架电商等多种电商业务形态的基础搜索质量;极致提升商品、种草视频和带货直播的购物转化效率,促进GMV增长; 3、深入参与核心搜索产品的需求设计,负责算法和工程的高质量交付,持续优化效果提升产品体验; 4、挖掘数据,构建Query理解、召回、排序等模型,提升电商搜索算法能力; 5、学习前沿技术,探索大模型等创新技术在AI搜索场景的落地。