logo of bytedance

字节跳动AML多模态算法工程师-Data

社招全职A194249地点:北京状态:招聘

任职要求


1、有自然语言处理计算机视觉、视频理解、推荐系统广告系统、联邦学习或者参与过大型在线机器学习统平台等研究或者技术背景同学优先;
2、有预训练基础技术,包括高效训练和封装部署服务化,NLP、CV、视频等相关的预训练模型及其下游应用优先;
…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与研发前沿算法、端云协同等下一代人工智能技术;
2、关注和推进技术在业务场景中的广泛应用,包括但不限于搜索、推荐、广告、审核、联邦学习等;
3、深入调研和关注多模态/NLP/CV等方向的前沿技术。
包括英文材料
NLP+
OpenCV+
推荐系统+
广告系统+
机器学习+
PyTorch+
TensorFlow+
还有更多 •••
相关职位

logo of bytedance
社招A05659

1、支持快速增长的内容套件业务,基于CV和多模态技术建立相应的标签体系; 2、探索多模态技术对不同领域场景的业务支持,提升用户消费核心指标; 3、处理丰富的多模态内容,为搜索、推荐提供底层技术支持; 4、探索多模态AIGC内容的生成,包括文生图、图生文等。

更新于 2024-06-17北京
logo of bytedance
社招A258472A

1、参与研发前沿算法、端云协同等下一代人工智能技术; 2、关注和推进技术在业务场景中的广泛应用,包括但不限于搜索、推荐、广告、审核、联邦学习等; 3、深入调研和关注多模态/NLP/CV等方向的前沿技术。

更新于 2024-05-27杭州
logo of bytedance
实习A25085

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、负责内部MonoTorch训练框架的研究与开发,服务于搜索,广告、推荐、搜索等场景; 2、负责实时高性能推理系统设计与开发,如算子融合、编译优化、模型量化、混合精度、异构硬件加速等; 3、负责性能优化与架构升级,持续提升数据预处理/训练/推理性能; 4、与算法工程师深度合作,为重点项目进行算法与系统的联合优化。

更新于 2025-02-18北京
logo of bytedance
校招A158012A

Team Introduction: Data AML is ByteDance's machine learning middle platform, providing training and inference systems for recommendation, advertising, CV (computer vision), speech, and NLP (natural language processing) across businesses such as Douyin, Toutiao, and Xigua Video. AML provides powerful machine learning computing capabilities to internal business units and conducts research on general and innovative algorithms to solve key business challenges. Additionally, through Volcano Engine, it delivers core machine learning and recommendation system capabilities to external enterprise clients. Beyond business applications, AML is also engaged in cutting-edge research in areas such as AI for Science and scientific computing. Research Project Introduction: Large-scale recommendation systems are being increasingly applied to short video, text community, image and other products, and the role of modal information in recommendation systems has become more prominent. ByteDance's practice has found that modal information can serve as a generalization feature to support business scenarios such as recommendation, and the research on end-to-end ultra-large-scale multimodal recommendation systems has enormous potential. It is expected to further explore directions such as multimodal cotraining, 7B/13B large-scale parameter models, and longer sequence end-to-end based on algorithm-engineering CoDesign. Engineering research directions include: Representation of multimodal samples Construction of high-performance multimodal inference engines based on the PyTorch framework Development of high-performance multimodal training frameworks Application of heterogeneous hardware in multimodal recommendation systems 1. Algorithmic research directions include: 2. Design of reasonable recommendation-advertising and multimodal cotraining architectures 3. Sparse Mixture of Experts (Sparse MOE) 4. Memory Network 5. Hybrid precision techniques 团队介绍: Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 课题介绍: 大规模推荐系统正在越来越多的应用到短视频、文本社区、图像等产品上,模态信息在推荐系统中的作用也越来越大。 字节实践中发现模态信息能够很好的作为泛化特征支持推荐等业务场景,端到端的超大规模多模态推荐系统的研究具有非常大的想象空间。 期望在算法和工程CoDesign基础上,对多模态Cotrain、7B/13B大规模参数模型、更长序列端到端等方向进一步进行探索。 工程上研究方向包括多模态样本的表征、基于 pytorch 框架的高性能多模态推理引擎、高性能多模态训练框架的构建、异构硬件在多模态推荐系统上的应用;算法上的研究方向包括设计合理的推荐广告和多模态Cotrain结构、Sparse MOE、Memory Network、混合精度等。 1、负责机器学习系统架构的设计开发,以及系统性能调优; 2、负责解决系统高并发、高可靠性、高可扩展性等技术难关; 3、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、任务编排、模型训练、模型推理、模型管理、数据集管理、工作流编排、ML for System等; 4、负责机器学习系统前瞻技术的调研和引入,比如:最新硬件架构、异构计算系统、GPU优化技术的引入落地; 5、研究基于机器学习方法,实现对集群/服务资源使用情况的分析和优化。

更新于 2025-05-26新加坡