字节跳动视觉大模型算法专家-Top Seed
任职要求
1、2026届获得博士学位,计算机、数学等相关专业优先; 2、具有优秀的基础算法、代码能力,熟练掌握C/C++或Python编程语言,ACM/ICPC、NOI/IOI、Top Coder、Kaggle等比赛获奖者优先; 3、具有扎实的计算机视觉、机器学习基础,熟悉CV、AIGC、NLP、RL等技术领域,在CVPR、ECCV、ICCV、NeurIPS、ICLR、SIGGRAPH或SIGGRAPH Asia等顶级会议上发表论文者优先; 4、在大模型领域或者RL领域,主导过大影响力的项目者优先; 5、具有出色的分析、解决问题的能力,能深入解决大模型训练和应用存在的问题,有自主探索解决方案的能力者优先; 6、具有良好的沟通协作能力,工作积极主动,能够与团队融洽合作,一起探索新技术,推进技术进步。
工作职责
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索大规模/超大规模视觉模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化; 2、参与计算机视觉、机器学习、通用人工智能领域的前沿研究与开发; 3、参与大规模/超大规模视觉基础模型的应用落地,探索开发以人工智能技术为核心、在未来生活中有更多使用场景的产品。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索大规模/超大规模视觉模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化; 2、参与计算机视觉、机器学习、通用人工智能领域的前沿研究与开发; 3、参与大规模/超大规模视觉基础模型的应用落地,探索开发以人工智能技术为核心、在未来生活中有更多使用场景的产品。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索大规模/超大规模视觉模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化; 2、参与计算机视觉、机器学习、通用人工智能领域的前沿研究与开发; 3、参与大规模/超大规模视觉基础模型的应用落地,探索开发以人工智能技术为核心、在未来生活中有更多使用场景的产品。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索大规模/超大规模视觉模型,并进行极致系统优化,数据建设、指令微调、偏好对齐、模型优化; 2、参与计算机视觉、机器学习、通用人工智能领域的前沿研究与开发; 3、参与大规模/超大规模视觉基础模型的应用落地,探索开发以人工智能技术为核心、在未来生活中有更多使用场景的产品。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、探索研究多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、探索大规模/超大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、模型优化;提升数据合成、Scalable Oversight、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建GUI/游戏等虚拟世界的通用多模态Agent; 4、利用预训练、仿真等技术对虚拟/现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。