logo of bytedance

字节跳动NLP/CV算法工程师-电商业务

社招全职A113477地点:上海状态:招聘

任职要求


1、在NLP、CV、多模态某个领域有较深入的研究,包括但不限于:机器翻译、多语言NLP、小样本学习、强化学习、图像视频理解、多模态等;
2、熟悉PyTorch/TensorFlow其中一种或多种框架模型的训练和部署,了解混合精度训练、分布式训练、TensorRT部署…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、知识图谱构建:基于抖音海量的内容数据,挖掘商品、用户、内容标签,构建人货场基础类目/标签/分层知识体系;
2、多语言技术:利用机器翻译、多语言NLP、小样本学习、强化学习等技术,赋能多个海外电商业务;
3、AIGC:基于前沿的AIGC模型能力,帮助降低商家素材制作成本,提升平台优质供给(短视频、图文等);
4、智能导购:利用NLP、CV、多模态技术,增强对短视频内容、图文、商品理解能力,支持搜索、推荐、商城全导购链路,提升消费者在内容场和货架场购物体验;
5、电商行业大模型:挖掘电商垂直领域大规模、高质量pretrain数据集,基于字节通用大模型,研发电商行业大模型,探索电商交互式导购新场景。
包括英文材料
NLP+
强化学习+
PyTorch+
还有更多 •••
相关职位

logo of bytedance
社招A198694

1、知识图谱构建:基于抖音海量的内容数据,挖掘商品、用户、内容标签,构建人货场基础类目/标签/分层知识体系; 2、多语言技术:利用机器翻译、多语言NLP、小样本学习、强化学习等技术,赋能多个海外电商业务; 3、AIGC:基于前沿的AIGC模型能力,帮助降低商家素材制作成本,提升平台优质供给(短视频、图文等); 4、智能导购:利用NLP、CV、多模态技术,增强对短视频内容、图文、商品理解能力,支持搜索、推荐、商城全导购链路,提升消费者在内容场和货架场购物体验; 5、电商行业大模型:挖掘电商垂直领域大规模、高质量pretrain数据集,基于字节通用大模型,研发电商行业大模型,探索电商交互式导购新场景。

更新于 2023-11-24北京
logo of bytedance
社招A213519

1、知识图谱构建:基于抖音海量的内容数据,挖掘商品、用户、内容标签,构建人货场基础类目/标签/分层知识体系; 2、多语言技术:利用机器翻译、多语言NLP、小样本学习、强化学习等技术,赋能多个海外电商业务; 3、AIGC:基于前沿的AIGC模型能力,帮助降低商家素材制作成本,提升平台优质供给(短视频、图文等); 4、智能导购:利用NLP、CV、多模态技术,增强对短视频内容、图文、商品理解能力,支持搜索、推荐、商城全导购链路,提升消费者在内容场和货架场购物体验; 5、电商行业大模型:挖掘电商垂直领域大规模、高质量pretrain数据集,基于字节通用大模型,研发电商行业大模型,探索电商交互式导购新场景。

更新于 2023-11-24珠海
logo of bytedance
社招A170925

团队介绍:Data-电商-平台治理-内容理解基础算法团队,主要 focus 在 NLP/CV/多模态的大模型算法和基础算法研发上,旨在沉淀CV/NLP/多模态方向上的业界SOTA模型,同时也需要在这几个方向持续深耕,针对电商数据优化算法,提升电商业务效果。 职位描述: 1、大模型算法研发:构建电商领域的大模型LLM底座,融合电商的知识,快速落地电商业务,例如:沉淀电商大模型预训练链路,研发电商NLP大模型,或者研发电商图文或者视频多模态大模型; 2、基础算法研发:持续建设和深耕NLP/CV/多模态基础预训练算法(BERT类算法),例如:沉淀&优化电商场景的预训练模型,包括超长文本/口语文本预训练,电商图片/视频自监督,适配电商商品的多模态表征学习等; 3、梳理&沉淀算法库,抽象算法接口,最大化提高算法/预训练模型的复用率,同时优化数据采集&模型训练&部署&推理的流程,提升研发效率; 4、技术输出:定期分享SOTA模型,赋能电商甚至公司级别的业务BU,沉淀专利和论文。

更新于 2023-11-24北京
logo of bytedance
社招A21178A

团队介绍:Data-电商-平台治理-内容理解基础算法团队,主要 focus 在 NLP/CV/多模态的大模型算法和基础算法研发上,旨在沉淀CV/NLP/多模态方向上的业界SOTA模型,同时也需要在这几个方向持续深耕,针对电商数据优化算法,提升电商业务效果。 职位描述: 1、大模型算法研发:构建电商领域的大模型LLM底座,融合电商的知识,快速落地电商业务,例如:沉淀电商大模型预训练链路,研发电商NLP大模型,或者研发电商图文或者视频多模态大模型; 2、基础算法研发:持续建设和深耕NLP/CV/多模态基础预训练算法(BERT类算法),例如:沉淀&优化电商场景的预训练模型,包括超长文本/口语文本预训练,电商图片/视频自监督,适配电商商品的多模态表征学习等; 3、梳理&沉淀算法库,抽象算法接口,最大化提高算法/预训练模型的复用率,同时优化数据采集&模型训练&部署&推理的流程,提升研发效率; 4、技术输出:定期分享SOTA模型,赋能电商甚至公司级别的业务BU,沉淀专利和论文。

更新于 2023-11-24上海