字节跳动NLP/CV算法工程师-电商业务
任职要求
1、在NLP、CV、多模态某个领域有较深入的研究,包括但不限于:机器翻译、多语言NLP、小样本学习、强化学习、图像视频理解、多模态等; 2、熟悉PyTorch/TensorFlow其中一种或多种框架模型的训练和部署,了解混合精度训练、分布式训练、TensorRT部署…
工作职责
1、知识图谱构建:基于抖音海量的内容数据,挖掘商品、用户、内容标签,构建人货场基础类目/标签/分层知识体系; 2、多语言技术:利用机器翻译、多语言NLP、小样本学习、强化学习等技术,赋能多个海外电商业务; 3、AIGC:基于前沿的AIGC模型能力,帮助降低商家素材制作成本,提升平台优质供给(短视频、图文等); 4、智能导购:利用NLP、CV、多模态技术,增强对短视频内容、图文、商品理解能力,支持搜索、推荐、商城全导购链路,提升消费者在内容场和货架场购物体验; 5、电商行业大模型:挖掘电商垂直领域大规模、高质量pretrain数据集,基于字节通用大模型,研发电商行业大模型,探索电商交互式导购新场景。
1、负责多模态 & 大模型在商品领域落地项目,涵盖商品内容理解&结构化/商品质量甄别/商品标题/图片生成/同款识别等任务。 2、负责商品检索相关的计算机视觉算法的创新和研究,包括但不限于:目标检测、图像分类、图像表征、图像校正与增强等相关算法研究。 3、负责商品知识库构建&知识标准化等工作。 4、负责跟踪业界前沿NLP&CV技术进展,寻找有价值的科研问题,开展前沿算法的研究工作,推进技术进步; 5、负责理解业务需求,进行针对性的研究算法,面向电商场景落地,发挥算法在实际应用中的价值。
团队介绍:字节跳动抖音搜索团队主要负责抖音搜索算法创新和架构研发工作,主要包括短视频、直播、本地生活、视觉搜索等多个业务线。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1、探索前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2、跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3、大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4、千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务的方方面面都有深入研究和创新。 1、参与抖音,今日头条,西瓜视频,剪映等App,以及国内电商,生活服务等重点业务的搜索推荐模型和策略改进,负责这些业务的搜索流量和用户渗透增长&搜索心智建设任务; 2、以推荐算法为核心技术栈,改进基于超大规模机器学习模型的推荐系统,覆盖从候选挖掘到召回,粗排,精排,多目标融合全链路技术环节; 3、探索短文本推荐和通用推荐技术的上限,重点是推荐和NLP技术的联合应用,以及多模态等前沿技术的探索。
1、负责抖音电商短视频和直播间的多模态内容理解、内容挖掘及结构化标签,构建内容分层体系,探索计算机视觉和多模态前沿技术,负责算法模型迭代升级,优化兴趣电商购物体验; 2、利用NLP、CV、多模态技术增强对电商内容理解的能力,在内容冷启、推搜策略、商达成长、供给生态等多个业务方向,支持电商业务目标高速发展; 3、负责AIGC图片/视频生成技术在电商领域的落地,参与电商基础模型构建以及AIGC能力在电商的价值探索; 4、负责抖店AIGC工具研发,不限于背景替换、虚拟试衣、文/图生视频等相关内容,积极跟进业界进展,推动技术在业务落地。