字节跳动电商场景LLM/VLM/AIGC训练工程师-国际电商
任职要求
1、本科及以上学历,计算机、软件工程、人工智能等相关专业优先,熟练掌握Linux环境下的C/C++或Python语言; 2、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,1年以上AutoML、模型推理/训练优化或AI相关工作经验; 3、能够熟练使用至少一种主流的机器学习框架(Tensorflow/PyTorch/MxNet或其他自研框…
工作职责
1、负责电商LLM/VLM/AIGC训练优化算法研究(和算法团队合作)和落地; 2、通过数据并行、模型并行、Pipeline并行、通信优化等基于CUDA的分布式训练框架大幅提升模型的训练速度与效率; 3、攻克电商LLM/VLM/AIGC训练全流程中工程技术问题,包括CT、SFT、RL等多个阶段,覆盖性能、资源、调度、平台化等能力; 4、与公司各算法部门深度合作,分析业务性能瓶颈,通过软硬结合的方式,高效部署与优化核心业务模型,落地到电商各产品线,投入AI工具链开发及技术生态的建设,支撑电商AI方向重要业务的发展。
1、负责大模型、AIGC服务链路和应用平台的开发,支撑相关业务的生产与高效迭代; 2、设计和实现机器学习相关的基础设施、框架、工具链等,并推动落地到业务中; 3、负责大规模样本数据的管理、标注、预处理、存储等能力建设,提供训练和推理使用的基础设施保障; 4、构建适合电商场景的AI应用Workflow编排框架和平台,方便电商各业务搭建AI应用链路; 5、负责电商GPU资源管理和优化调度,并建设管理工具平台,优化GPU管理效率,提升资源池整体利用率; 6、探索业界前沿的深度学习相关技术,持续提升平台能力、降低研发与算法的使用成本。
关于我们: AI Business 成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于大模型技术能力建设和 AI 原生应用和产品的打造,旨在用最先进的 AI 技术重塑平台竞争力,为商家和用户带来极致电商体验。 作为跨境电商领域的 AI 先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对 AI 领域人才的培养和发展。我们已经汇聚了业内顶尖的 AI 算法专家、AI 工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的 AI 人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 职位描述: 1、负责多语言大语言模型(LLM)的预训练、微调及优化,探索高效训练策略(如低资源语种能力迁移、任务调度优化等),提升模型性能与跨文化场景适应性; 2、构建多模态大模型技术体系,包括图文生成、视频内容生成、多模态检索与信息抽取,支持商品虚拟试穿、智能客服等业务场景。 3、推动大模型与业务深度融合,开发基于LLM的对话系统、Agent产品及RAG系统,优化电商文本生成、跨语言信息匹配、时间序列预测等场景的智能决策能力; 4、设计强化学习对齐算法(如RLHF/DPO),提升模型在垂直领域(如商品推荐、用户交互)的精准度与可控性。 4、实现大模型的高效推理部署,包括模型压缩量化、GPU并行计算优化(如CUDA加速),确保高并发场景下的服务稳定性; 5、探索生成式AI与电商场景结合的前沿技术(如AIGC内容生成、多模态商品检索),推动技术规模化落地。
依托淘宝、天猫超大规模商业场景,我们致力于通过最前沿的多模态大模型技术驱动万亿级交易额的增长。在这里你将面对业界最复杂的电商图文、视频语境,与顶尖团队一起探索 AIGC 与多模态技术在搜索广告全链路(召回、排序、创意生成)的深度融合与变现。包括并不限于: 1. 负责电商多模态统一表征: 构建面向海量商品、直播、短视频的超大规模预训练模型(VLM),解决多模态语义对齐、细粒度特征提取及跨模态检索难题。 2. 负责生成式广告物料(AIGC): 探索 Diffusion Model、LLM 在广告创意自动生成(文案、头图、视频步进)中的应用,提升物料投放质量与点击转化率。 3. 负责多模态驱动的商业决策: 将多模态感知能力深度注入广告全链路(从搜索词理解到广告 CTR/CVR 预估),实现从“看懂图片”到“理解意图”的决策升级。 4. 负责全链路多物料优化: 针对商品、直播间、短视频等多类型物料,设计统一的跨模态排序算法,优化搜索场景下的多元流量分配效率。 5. 负责视觉底层技术创新: 针对电商复杂场景,优化 OCR、商品检测、度量学习及视觉搜索等经典任务,建立行业领先的视觉基座。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:TikTok Shop是以TikTok为载体的内容电商业务,致力于成为用户发现并获取优价好物的首选平台,在直播电商、视频内容电商等多场景下,TikTok Shop希望能为用户提供更个性化、更主动、更高效的消费体验,为商家提供稳定可靠的平台服务,在更多的地区实现没有难卖的优价好物,让美好生活触手可得的使命。我们邀请你来此成长、钻研,发掘无限的潜力,一起应对技术和业务上的挑战。目前团队拥有丰富的国际产品研发经验,包容多元的文化,且在全球设立研发团队,邀请你来一起接受跨国合作的挑战,还有出差外派机会在等你! 1、负责大模型、AIGC服务链路和应用平台的开发,支撑相关业务的生产与高效迭代; 2、设计和实现机器学习相关的基础设施、框架、工具链等,并推动落地到业务中; 3、负责大规模样本数据的管理、标注、预处理、存储等能力建设,提供训练和推理使用的基础设施保障; 4、构建适合电商场景的AI应用Workflow编排框架和平台,方便电商各业务搭建AI应用链路; 5、负责电商GPU资源管理和优化调度,并建设管理工具平台,优化GPU管理效率,提升资源池整体利用率; 6、探索业界前沿的深度学习相关技术,持续提升平台能力、降低研发与算法的使用成本。