logo of bytedance

字节跳动大模型平台研发工程师-Seed

社招全职A239389地点:深圳状态:招聘

任职要求


1、对语言大模型、多模态大模型、智能代理Agent技术以及大模型的部署流程有基本的了解和认识;
2、具备熟练的Python/Go语言编程能力和良好的编程习惯和代码管理能力;
3、参与开发和优化大模型的自动评估技术,以提升模型的易用性和性能表现;
4、熟悉服务端基础…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。
Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。

1、负责字节跳动机器学习平台的开发,支撑公司相关业务的算法生产与高效迭代;
2、设计和实现机器学习相关的基础设施、框架、工具链等,并推动落地到业务中;
3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。
包括英文材料
大模型+
AI agent+
Python+
Go+
编程规范+
还有更多 •••
相关职位

logo of bytedance
社招A78654

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责字节跳动机器学习平台的开发,支撑公司相关业务的算法生产与高效迭代; 2、设计和实现机器学习相关的基础设施、框架、工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。

更新于 2024-10-23杭州
logo of bytedance
社招A103163

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责字节跳动机器学习平台的开发,支撑公司相关业务的算法生产与高效迭代; 2、设计和实现机器学习相关的基础设施、框架、工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。

更新于 2024-10-23北京
logo of bytedance
社招A122937

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责字节跳动机器学习平台的开发,支撑公司相关业务的算法生产与高效迭代; 2、设计和实现机器学习相关的基础设施、框架、工具链等,并推动落地到业务中; 3、探索业界前沿的机器学习相关技术,持续提升平台能力、降低算法使用成本。

更新于 2024-10-23上海
logo of bytedance
社招3年以上A84559A

1、负责数据清洗与治理,协同数据工程师与算法团队,对原始训练数据进行收口、分类、清洗、脱敏、结构化;深入理解各类数据的来源、特性与用途,确保数据质量与合规性;追踪数据生命周期,确保数据可追溯、可还原、可解释; 2、负责数据归档与版本管理,设计并维护训练数据的归档策略、数据标注规范、数据版本体系,管理“哪些数据用于训练,哪些未被使用”的元信息及其配比记录,负责训练数据的文档化,包括数据源描述、处理流程、清洗策略、抽样配比等关键信息; 3、产品化协作与技术对接,作为数据产品接口人,与算法、数据工程、平台团队密切合作,推动训练数据产品方案的落地;与研发团队共同推进数据平台的能力建设与数据工具链打通,提升数据处理效率与规范性,推进训练数据资产的可复用性与积累性,持续构建结构化数据资产池; 4、数据使用策略与监控,与模型团队配合,输出不同训练任务的数据构成建议,制定数据使用与采样策略,建立关键数据指标监控机制,评估数据质量对模型效果的影响。

更新于 2025-06-26北京