字节跳动AI搜索推荐后端开发工程师-Data AML
任职要求
1、2026届获得本科及以上学历,计算机、人工智能等相关专业优先; 2、热爱计算机科学和互联网技术,精通至少一门编程语言,包括但不仅限于:Java、C、C++、PHP、Python、…
工作职责
团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、负责架构设计和开发,为亿级用户提供优质信息服务和极致体验; 2、参与搜索、推荐和智能体应用的技术方案设计、代码开发和系统性能调优; 3、协助团队攻克各种高并发、数据隔离、系统解耦等方面的技术难关; 4、以AI技术为驱动,解决内容理解、生成、合规等内容生态的共性技术需求; 5、参与大模型相关前沿业务系统研发。
1、以AI技术为驱动,主导或参与信息流推荐、多模态搜索、智能内容中台建设; 2、参与亿级内容分发系统架构设计与优化,结合AI技术提升搜推一体化效果; 3、构建AI能力中台,解决内容理解、生成、合规等内容生态的共性技术需求; 4、参与SaaS应用的生产调优,解决大规模场景下系统的性能和稳定性问题。
1、以AI技术为驱动,主导或参与信息流推荐、多模态搜索、智能内容中台建设; 2、参与亿级内容分发系统架构设计与优化,结合AI技术提升搜推一体化效果; 3、构建AI能力中台,解决内容理解、生成、合规等内容生态的共性技术需求; 4、参与SaaS应用的生产调优,解决大规模场景下系统的性能和稳定性问题。
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。
【业务介绍】 作为公司统一的机器学习平台团队,负责调度公司所有模型训练与推理资源;基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。 【岗位职责】 1、负责机器学习链路,离在线数据相关的开发工作,包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作;包括样本平台,特征平台,训练平台,推理平台等AI应用后台建设等; 3、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。