logo of bytedance

字节跳动多模态智能算法工程师/专家-智能创作

社招全职3年以上A20923B地点:深圳状态:招聘

任职要求


1、计算机科学、软件工程、电子工程或相关领域的硕士及以上学历;
2、3年及以上相关领域工作经验,至少熟悉NLP计算机视觉机器学习等技术之一;
3、熟练掌握C++/Python等编程语言,具有扎实的编程基础和良好的编码习惯;
4、深入了解深度学习框架,如TensorFlowPyTorch等的使用和部署;
5、具备丰富的算法研究和实践经验,能够独立解决复杂技术问题;
6、具备良好的沟通能力和团队合作精神,能够迅速适应变化并解决问题;
7、在顶级学术会议上发表论文者优先,在多模态、计算机视觉机器学习领域的比赛中获得过优异成绩者优先。

工作职责


团队介绍:智能创作团队是字节跳动创作场景业务中台,负责了抖音、剪映等产品的技术和业务研发,涵盖了计算机视觉、深度学习、高性能计算、图形学、特效引擎等技术领域,并以多种形式向公司内部各业务线提供业界前沿的内容理解、内容创作、互动体验与消费的能力和行业解决方案,同时通过火山引擎为企业客户提供服务。

1、研究和开发多模态智能生成和编辑算法,包括文案、图像、视频等;
2、设计和优化现有算法,提高性能和准确性,确保高质量的用户体验;
3、深入调研和关注多模态/NLP/CV等方向的前沿技术,及时将新技术应用到产品中;
4、与产品经理、设计师和其他工程师紧密合作,确保产品迭代的高效推进。
包括英文材料
学历+
NLP+
OpenCV+
机器学习+
C+++
Python+
编程规范+
深度学习+
TensorFlow+
PyTorch+
算法+
相关职位

logo of bytedance
社招RS151

团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、负责多模态大模型的研发和应用,研究相关技术在豆包、智能助手、智能硬件等领域的全新应用和解决方案,包括而不限于多模态理解生成,视觉Agent等能力,研发以人工智能技术为核心的新技术、新产品; 2、探索超大规模模型,进行极致系统优化; 3、数据建设、指令微调、偏好对齐、模型优化; 4、相关应用落地,包括看图对话、问答、搜索、生成创作、逻辑推理、代码生成等; 5、在未来生活中的更多使用场景的深入研究和探索,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式。

更新于 2020-04-26
logo of vivo
社招3年以上研发类

作为核心算法成员,参与AI图像相关算法研发,主要服务于下一代智能相册系统。主要工作包括: 一、图像理解方向: 1)开发基于多模态语义的图像理解算法:人物识别、事件聚类、情绪识别、场景识别等;构建个性化的图像语义标签体系; 2)设计图像内容质量评估模型(重复、模糊、人脸表情等)提升用户体验; 3)探索RAG、多模态图像大模型、文本大模型联动下,agent能力建设和开发。 二、 图像AIGC方向(创作与编辑): 1)研究并实现图像生成与编辑算法,如背景替换、人像美化、风格迁移、文生图,图生图等; 2)参与基于 Diffusion基础模型训练; 3)参与ControlNet、Inpainting、aigc编辑大模型等前沿应用模型的业务开发和落地;

logo of bytedance
社招A155282

团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的AI大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、多模态引擎研发:研发融合文本、视觉、语音的角色类大模型,优化角色生成的真实性与情感表达(如虚拟助手、游戏NPC、互动剧角色),突破多模态对齐、长期记忆、行为一致性等技术难点; 2、极致性能优化:超大规模模型的分布式训练优化,提升角色类模型的推理效率与资源利用率,指令微调、偏好对齐、数据增强等技术的场景化创新; 3、业务场景落地:支持豆包、猫箱等产品的角色生成需求,覆盖对话、创作、教育等场景,探索角色模型在智能硬件、元宇宙等领域的沉浸式交互能力; 4、前沿探索:研究人格化模型在情感计算、社会常识推理等方向的突破,定义AI角色从「功能执行」到「人格化陪伴」的技术范式。

更新于 2025-02-13
logo of bytedance
社招A130850

团队介绍:字节跳动豆包大模型团队成立于 2023 年,致力于开发业界最先进的 AI 大模型技术,成为世界一流的研究团队,为科技和社会发展作出贡献。 豆包大模型团队在AI领域拥有长期愿景与决心,研究方向涵盖NLP、CV、语音等,在中国、新加坡、美国等地设有实验室和研究岗位。团队依托平台充足的数据、计算等资源,在相关领域持续投入,已推出自研通用大模型,提供多模态能力,下游支持豆包、扣子、即梦等50+业务,并通过火山引擎开放给企业客户。目前,豆包APP已成为中国市场用户量最大的AIGC应用。 1、多模态引擎研发:研发融合文本、视觉、语音的角色类大模型,优化角色生成的真实性与情感表达(如虚拟助手、游戏 NPC、互动剧角色),突破多模态对齐、长期记忆、行为一致性等技术难点; 2、极致性能优化:超大规模模型的分布式训练优化,提升角色类模型的推理效率与资源利用率,指令微调、偏好对齐、数据增强等技术的场景化创新; 3、业务场景落地:支持豆包、猫箱等产品的角色生成需求,覆盖对话、创作、教育等场景,探索角色模型在智能硬件、元宇宙等领域的沉浸式交互能力; 4、前沿探索:研究人格化模型在情感计算、社会常识推理等方向的突破,定义AI角色从「功能执行」到「人格化陪伴」的技术范式。

更新于 2025-02-24