字节跳动AML多模态算法工程师(智能内容)-Data
任职要求
1、熟悉多模态常用算法,熟练掌握Transformer等算法; 2、熟悉常见的图片分类以及目标检测相关算法,能独立完成标签体系的搭建; 3、有OCR、ASR、TTS相关经验者优先; 4、熟悉生成模型,有AIGC相关经验者优先; 5、熟悉Linux开发环境,有扎实的算法和数据结构功底,熟练使用C++和Python语言; 6、良好的问题解决能力、团队合作意识和沟通能力,有相关业务场景实践经验者优先。
工作职责
1、支持快速增长的内容套件业务,基于CV和多模态技术建立相应的标签体系; 2、探索多模态技术对不同领域场景的业务支持,提升用户消费核心指标; 3、处理丰富的多模态内容,为搜索、推荐提供底层技术支持; 4、探索多模态AIGC内容的生成,包括文生图、图生文等。
团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、为全球企业级客户提供高效的算法服务,包括但不限于传统搜推广、大模型技术与搜推结合以及大模型应用产品; 2、理解不同行业的客户场景和需求,落地相应的算法解决方案,包括但不限于电商/内容推荐、基于大模型技术的搜索方案以及知识库问答等LLM上层应用; 3、探索大模型相关方向的前沿技术,推进相关技术在业务场景的落地,包括但不限于长序列建模/多模态/RAG/智能体; 4、与产品研发团队协作建设平台产品,在多云环境下为全球范围内的客户提供算法解决方案,包括但不限于智能推荐平台和大模型搜推平台。
1、参与研发前沿算法、端云协同等下一代人工智能技术; 2、关注和推进技术在业务场景中的广泛应用,包括但不限于搜索、推荐、广告、审核、联邦学习等; 3、深入调研和关注多模态/NLP/CV等方向的前沿技术。
1、参与研发前沿算法、端云协同等下一代人工智能技术; 2、关注和推进技术在业务场景中的广泛应用,包括但不限于搜索、推荐、广告、审核、联邦学习等; 3、深入调研和关注多模态/NLP/CV等方向的前沿技术。
团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。 1、专注改进大模型在现实世界复杂任务的效果,追求通用可规模化的方法,包括不限于复杂推理、多模态、自主Agent、以及可扩展监督和大规模数据合成等方法; 2、推动大模型技术在高难度场景中的前沿应用,包括不限于Agent系统、专业咨询、科研协作、深度洞察、个性化教育等高价值场景; 3、面向广泛的现实世界高价值任务,设计科学、严谨的量化评测体系,提升模型的智能水平。