字节跳动AML多模态算法工程师-Data
任职要求
1、有自然语言处理、计算机视觉、视频理解、推荐系统、广告系统、联邦学习或者参与过大型在线机器学习统平台等研究或者技术背景同学优先; 2、有预训练基础技术,包括高效训练和封装部署服务化,NLP、CV、视频等相关的预训练模型及其下游应用优先; 3、熟练掌握Pytorch、TensorFlow等深度学习框架,Python或者Java等编程语言; 4、有领域顶级会议文章(NeurIPS、ICML、ICLR、CVPR、ICCV、ACL、KDD等)、相关实习经验或者ACM竞赛获奖者优先。
工作职责
1、参与研发前沿算法、端云协同等下一代人工智能技术; 2、关注和推进技术在业务场景中的广泛应用,包括但不限于搜索、推荐、广告、审核、联邦学习等; 3、深入调研和关注多模态/NLP/CV等方向的前沿技术。
1、参与研发前沿算法、端云协同等下一代人工智能技术; 2、关注和推进技术在业务场景中的广泛应用,包括但不限于搜索、推荐、广告、审核、联邦学习等; 3、深入调研和关注多模态/NLP/CV等方向的前沿技术。
1、支持快速增长的内容套件业务,基于CV和多模态技术建立相应的标签体系; 2、探索多模态技术对不同领域场景的业务支持,提升用户消费核心指标; 3、处理丰富的多模态内容,为搜索、推荐提供底层技术支持; 4、探索多模态AIGC内容的生成,包括文生图、图生文等。
团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、负责豆包模型AIGC相关技术的研究和开发,包括图像、视频或3D生成&编辑等,探索基于扩散和自回归的技术路线,以实现高质量的输出; 2、解决生成视频/图像中的时间一致性、空间连贯性和可控性等核心研究难题; 3、紧跟生成方向(扩散模型、Transformer、生成对抗网络等)的最新研究动态,并对创新想法进行原型验证; 4、依托公司和业界的大模型和基础CV技术,构建面向ToB业务应用的多模态算法能力,帮助业务取得成功。
团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、负责豆包模型AIGC相关技术的研究和开发,包括图像、视频或3D生成&编辑等,探索基于扩散和自回归的技术路线,以实现高质量的输出; 2、解决生成视频/图像中的时间一致性、空间连贯性和可控性等核心研究难题; 3、紧跟生成方向(扩散模型、Transformer、生成对抗网络等)的最新研究动态,并对创新想法进行原型验证; 4、依托公司和业界的大模型和基础CV技术,构建面向ToB业务应用的多模态算法能力,帮助业务取得成功。