logo of bytedance

字节跳动多模态/AIGC算法工程师-国际电商

社招全职A21834地点:上海状态:招聘

任职要求


1、计算机或相关专业,本科及以上学历(硕士学位/博士学位优先);
2、在多模态理解(MLLM)、大语言模型(LLM)、AIGC(图像/视频生成)或强化学习(RL)等领域有深入研究,包括但不限于:模型微调(SFT/LoRA)、思维链(CoT)、RAG等;
3、熟悉PyTorch/TensorFlow等深度学习框架,具备优秀的编程功底和算法实现能…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责全球商品信息结构化与标准化:利用LLM及MLLM技术,在跨语言、跨文化背景下,实现商品属性自动抽取、类目挂载及标准库对齐,构建高精度的全球统一商品目录;
2、负责Listing质量优化:探索Agentic Learning与LLM在商品详情页(Title、Description、SEO)的自动化生成与动态优化,结合用户反馈进行强化学习(RL),持续提升搜索/推荐转化率;
3、负责商品素材AIGC生产:研发基于Diffusion模型或多模态大模型的AIGC方案,支持商品图背景合成(Inpainting)、AI模特生成、短视频自动化生产,降低商家内容制作成本;
4、探索前沿技术落地:跟踪并落地MLLM(多模态大模型)、Agent架构及强化学习(RL)在电商垂直场景的应用,打造具备自进化能力的商品理解与创作智能体。
包括英文材料
学历+
大模型+
AIGC+
强化学习+
SFT+
RAG+
PyTorch+
还有更多 •••
相关职位

logo of kuaishou
社招3-5年J0011

1、负责研发行业领先的AIGC素材创意生成技术,包括多模态理解、多模态检索、多模态生成等前沿技术,应用于电商、商业化、本地生活等场景的创意素材生成; 2、负责大模型(LLM、MLLM)的指令微调、RLHF等技术的深入探索与研发,提升文案内容的生成质量; 3、负责研发AIGC素材创意生成平台,实现自动化、智能化的素材创意内容的生成与推荐。

更新于 2026-04-07杭州|北京
logo of bytedance
社招A138781

团队介绍:团队负责国际化电商业务下的智能客服、机器翻译和电商文案创作能力的研发,包括开发基于LLM的下一代对话机器人,以及构建电商机器翻译和文案生成的解决方案,以改善电商购物体验。我们目前正在寻找对自然语言处理和机器学习有深刻理解的优秀工程师,特别是那些具有LLM、机器翻译和AI对话等方面扎实技能和经验的人才。 职位描述: 1、负责开发国际化电商的智能客服:与我们的产品和运营团队密切合作,理解用户意图、设计解决方案,并利用最先进的LLM技术以对话方式向用户提供这些解决方案。你将有机会开发各类NLP模型(如文本分类、机器阅读、摘要、各类场景的QA生成等)和预测模型(如用户问题预测、机器人操作预测等)来实现上述目标。此外,你将会参与基于LLM的纯生成式多轮对话任务型机器人的开发; 2、负责开发和优化国际化电商的机器翻译服务,涉及电商场景下数十种场景和语向的翻译质量优化以及相关基础技术的研究,包括各类商品信息翻译、客服对话翻译等,涉及纯文本翻译和多模态翻译; 3、负责开发和优化商品文案的多模态AIGC模型,包括产品标题、卖点、描述的生成和直播剧本创作等。你将有机会应用最先进的AIGC模型来进行各类文案创作,以节省平台和商家的运营成本; 4、参与国际化电商中文和多语言LLM的基础能力开发,为国际化电商的各个产品提供LLM能力。

更新于 2023-11-23珠海
logo of bytedance
社招A67882B

团队介绍:字节跳动搜索团队主要负责抖音、今日头条、西瓜视频等产品的搜索算法创新和架构研发工作。我们使用最前沿的机器学习技术进行端到端建模并不断创新突破,同时专注于分布式系统、机器学习系统的构建和性能优化,从内存、Disk等优化到索引压缩、召回、排序等算法的探索,充分给同学们提供成长自我的机会。主要工作方向包括:1)探索最前沿的NLP技术:从基础的分词、NER,到应用上的Query分析、基础相关性等,全链路应用深度学习模型,每个细节都充满挑战;2)探索跨模态匹配技术:在搜索中应用CV+NLP深度学习技术,让视频搜索拥有更强大的检索能力;3)探索大规模流式机器学习技术:应用大规模机器学习,解决搜索中的推荐问题,让搜索更加个性化更加懂你;4)探索千亿级数据规模的架构:从大规模离线计算,分布式系统的性能、调度优化,到构建高可用、高吞吐和低延迟的在线服务,方方面面都进行深入研究和创新。 1、探索搜索引擎与大模型、LLM、MLLM、多模态、机器学习、强化学习等前沿技术的结合,实现搜索引擎全链路革新并进行极致的系统优化,探索提升AI搜索引擎的能力,包含而不限于相关性、权威性、时效性、意图理解能力等;探索LLM适性索引、LLM相关性、生成式召回、排序大模型等; 2、构建大规模高质量数据(数据建设、数据抓取与解析、数据合成等)、训练和优化AI搜索的机器学习模型(多模态内容理解、指令微调、索引筛选、Query分析、Scalable Oversight、Long CoT、模型推理/规划、模型优化、构建全面客观准确的评测体系等); 3、探索推进AI搜索、AIGC创新应用的落地(包含而不限于豆包、电商、抖音、智能硬件、AI找搭配/虚拟穿搭等大模型应用场景),研发以人工智能技术为核心的新技术、新产品,探索满足用户的智能交互需求,提升现实与物理世界的交互能力。

更新于 2025-02-25珠海
logo of bytedance
社招A77544A

团队介绍:Data-电商-平台治理算法团队,通过优化算法,和业务团队协作,对字节旗下的电商产品进行全方位的质量和生态的治理,既包括风险、违规和低质问题的打击,也包括健康电商生态的建设和优化,在最大程度的优化平台治理的效果的同时提升治理的工作效率,降低成本。另外一方面,平台治理算法团队致力于攻坚前沿的AI技术,以技术驱动推动业务的变革和发展,领域涉及广泛,包括但不限于NLP/CV/多模态/大模型/图算法/序列算法等。 课题介绍: 背景:电商智能审核业务比较复杂,随着审核技术的不断演进,各个领域面临着新的风险问题和对抗形式,这对大模型的应用提出了新的挑战。例如,在电商审核业务中,涉及审核PBR变更、长文本、长时序、多语言、少样本和AIGC生成对抗等问题时,现有的开源大模型表现往往不尽人意。因此,针对这些挑战,我们亟需研发专门针对电商智能审核的大模型,以提升其在电商治理中的有效性和适应性。特别的,针对电商业务特点,我们需要探索高质量的数据自动生成、高效的MOE Embedding、Auto-Prompt生成、高质量 COT输出、大模型知识蒸馏等。此外,该模型应能够满足电商审核业务的需求,实现高准确率的自主决策和可解释性的COT生成,显著减少误判。针对动态变化的审核PBR变更,它能够通过RAG模块自动检索类似的审核案例,将复杂的审核PBR分解为简单的原子任务,自动拆分出驳回和豁免原子任务,并自动调用相应的Tools来解决这些任务,从而建立“知道拒绝并且知道为何拒绝”的业内领先智能审核系统。最终,大模型智能审核系统的审核效果需要接近或者超过人工审核,往全机审的路线上演进。 研究方向:模态融合能力:提升文本、音频、图像、视频和直播等多模态的细粒度理解能力,实现高准确率的自主决策和可解释性的COT生成;Few-Shot能力:探索电商多语言、长时序和少样本问题,增强Few-Shot和Zero-Shot能力,针对多变的业务规则具备复杂指令和Auto-Prompt生成能力;攻防对抗能力:研究AIGC图像视频的判别,增强审核大模型对隐晦、抽象的生成式内容的攻防对抗能力;Agent能力:具备调用RAG模块,使用Tools,和Auto-planning能力;提升大模型的动态推理和反思能力。 1、深入理解电商业务,探索基于大模型、多模态模型,持续提升商家/达人在准入、发品、售后等各个业务场景的风险识别效果; 2、提升商品治理审核智能化水平,迭代优化治理大模型,提升大模型对治理规则和商品信息的理解,实现高准高召的问题识别和自动处置; 3、负责强化电商场景下,大模型推理和反思能力,通过商品业务域SFT、高质量Cot、强化学习、数据合成等技术方案,提升商品治理大模型底座能力; 4、参与构建挖掘电商直播、商品、商家和带货主播等多种实体的数据,对大规模网络/海量特征序列进行建模,支撑商家、达人分类/风险团伙挖掘等业务场景解决问题,并为商家/达人治理提供支持; 5、参与构建大规模的图存储和图学习平台,完善电商社区内商家/商品/达人/视频内容的关系建设,构建电商实体通用表征能力,赋能治理业务; 6、建设售后服务MLLM基座大模型,并利用RAG/Agent/RL等技术,解决复杂场景下对体验问题的理解能力。

更新于 2025-05-27北京