字节跳动大模型平台研发工程师-Seed
任职要求
1、对语言大模型、多模态大模型、智能代理Agent技术以及大模型的部署流程有基本的了解和认识; 2、具备熟练的Python/Go语言编程能力和良好的编程习惯和代码管理能力; 3、参与开发和优化大模型的自动评估技术,以提升模型的易用性和性能表现; 4、熟悉服务端基础…
工作职责
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责字节跳动机器学习平台的开发,支撑公司相关业务的算法生产与高效迭代; 2、设计和实现机器学习相关的基础设施、框架、工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责字节跳动机器学习平台的开发,支撑公司相关业务的算法生产与高效迭代; 2、设计和实现机器学习相关的基础设施、框架、工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。
1、负责数据清洗与治理,协同数据工程师与算法团队,对原始训练数据进行收口、分类、清洗、脱敏、结构化;深入理解各类数据的来源、特性与用途,确保数据质量与合规性;追踪数据生命周期,确保数据可追溯、可还原、可解释; 2、负责数据归档与版本管理,设计并维护训练数据的归档策略、数据标注规范、数据版本体系,管理“哪些数据用于训练,哪些未被使用”的元信息及其配比记录,负责训练数据的文档化,包括数据源描述、处理流程、清洗策略、抽样配比等关键信息; 3、产品化协作与技术对接,作为数据产品接口人,与算法、数据工程、平台团队密切合作,推动训练数据产品方案的落地;与研发团队共同推进数据平台的能力建设与数据工具链打通,提升数据处理效率与规范性,推进训练数据资产的可复用性与积累性,持续构建结构化数据资产池; 4、数据使用策略与监控,与模型团队配合,输出不同训练任务的数据构成建议,制定数据使用与采样策略,建立关键数据指标监控机制,评估数据质量对模型效果的影响。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、深度参与图像生成、视频生成、多模态视觉理解等视觉大模型训推一体化平台建设; 2、负责视觉大模型训练优化算法研究和落地,通过5D并行、通信优化、AutoCheckpointing等分布式训练手段提升模型的训练速度与效率; 3、通过编译优化、模型并行优化、图融合、高性能算子开发、低精度计算、Memory复用、Cache优化、高并发服务请求优化等技术,打造业界领先的高性能大模型训推引擎; 4、与算法部门深度合作,分析性能瓶颈,通过软硬结合提升模型训推效率,优化和部署视觉大模型,支持AI工具链和技术生态建设,推动字节跳动AI关键业务发展。