logo of bytedance

字节跳动AIGC算法专家-智能创作(北京/上海/深圳/杭州)

社招全职1年以上A214122地点:北京状态:招聘

任职要求


1、1年及以上计算机视觉或AI相关工作经验;
2、积极主动有热情,能与团队融洽合作相处,具备较强的沟通能力;
3、有图像生成与AIGC项目落地经验者优先;
4、有图像生成或多模态方向顶会论文者优先。

工作职责


团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。

1、负责多模态/GAN/SD等生成相关算法研发与优化,跟进计算机视觉领域的前沿技术研究;
2、参与技术规划制定,把握图像、视频生成技术最新发展趋势;
3、推动技术在特效/素材生成/辅助设计等领域的应用。
包括英文材料
OpenCV+
相关职位

logo of bytedance
社招A259550

团队介绍:智能创作团队是字节跳动的创作场景业务中台,以AI赋能创造,致力于通过AI技术降低创作门槛,赋能视觉内容生产与创作的智能化升级。团队深度支持抖音、剪映、即梦、豆包、商业化等多个业务线,持续深耕图片与视频生成、智能剪辑、数字人、特效等多个业务场景,通过由AI驱动的智能化工具与算法,为用户提供了更智能、更便捷、更丰富的创作体验,助力普通用户轻松实现高质量内容创作,同时为专业创作者提供强大的技术支持,推动内容生态的繁荣与创新。 1、探索研究多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术; 2、基于通用大模型,结合创作垂类应用场景,进行相关的数据建设、指令微调、偏好对齐、模型优化,升数据合成、模型推理 & 规划能力,构建全面客观准确的评测体系,探索提升垂类大模型能力; 3、探索突破包括而不限于多模态RAG,视觉COT与Agent等在内的多模态模型、世界模型进阶能力,构建以智能创作为核心的多模态AI Agent;推动相关的新技术、新产品落地。

更新于 2024-10-21
logo of bytedance
社招TVVV

1、负责3D能力与图像/视频生成结合的算法研发与优化,跟进三维视觉领域的前沿技术研究; 2、支持字节跳动各个产品线3D相关的业务需求; 3、跟进生成领域的新技术; 4、负责推动3D能力与视频生成相关技术落地于特效、视频编辑、商业化等领域的应用; 5、根据团队的整体目标和规划,进行相关的研发工作。

更新于 2021-12-07
logo of honor
社招3年以上研发类

1、研发智能体算法,提升手机影像系统中模块化组件的自动化决策能力(如场景识别、参数调优、算力分配),包括不限于多智能体协同,混合专家模型,多模态通才模型,视频理解模型开发; 2、场景理解类算法研发工作,辅助智能体、拍照、3A等下游算法的输入; 3、设计面向复杂场景的自主理解决策,优化拍摄全链路的任务调度与资源协同(如AI构图、拍照链路决策,拍照场景智能问答); 4、构建基于强化学习/RAG技术智能体框架,提升相机的智能体验,提升剪辑效率,提升用户出片率; 5、探索Agent技术与3A/AIGC/ISP等算法的深度融合,推动影像系统从“被动响应”向“主动创作”演进。

更新于 2025-05-23
logo of amap
社招3年以上技术类-算法

部门介绍: 我们是阿里巴巴-高德的大模型和AIGC核心部门,承接公司的重点业务,包括本地生活场景中的广告创意、商品理解、内容智能创作和分发,出行场景的AI智能化等,研究领域广泛,包括但不限于多模态大模型、大语言模型、图像生成、图像编辑美化、视频生成和视频理解等,团队技术氛围好,成长空间大,拥有充足的研发资源和大量的业务应用数据,团队多篇论文入选paper digest最有影响力论文名单。 岗位职责: 1、负责多模态媒体内容的理解、编辑、生成相关新技术的应用落地和探索,解决在内容智能创作以及广告创意等的应用中的算法难点; 2、研究和应用计算机视觉(CV)等相关技术,熟悉多模态大模型或者图像编辑生成等方向的经典网络模型,了解各种常用网络训练方式及调优方式; 3、前沿技术探索:跟踪和深入探索技术研究前沿,提出创新性方案,形成论文或者专利。

更新于 2025-09-11