字节跳动电商场景LLM/VLM/AIGC训练工程师-国际电商
任职要求
1、本科及以上学历,计算机、软件工程、人工智能等相关专业优先,熟练掌握Linux环境下的C/C++或Python语言; 2、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,1年以上AutoML、模型推理/训练优化或AI相关工作经验; 3、能够熟练使用至少一种主流的机器学习框架(Tensorflow/PyTorch/MxNet或其他自研框架),熟悉各种模型/数据并行训练框架优先; 4、了解主流LLM/VLM/AIGC算法模型,有LLM/VLM/AIGC模型训练加速落地经验者优先; 5、有大模型训练优化经验,熟悉FSDP/DeepSpeed/Megatron等分布式训练框架经验者优先; 6、具有独立解决问题的能力,良好的团队合作精神,有强烈的工作责任心,较好的学习能力、沟通能力和自驱力。
工作职责
1、负责电商LLM/VLM/AIGC训练优化算法研究(和算法团队合作)和落地; 2、通过数据并行、模型并行、Pipeline并行、通信优化等基于CUDA的分布式训练框架大幅提升模型的训练速度与效率; 3、攻克电商LLM/VLM/AIGC训练全流程中工程技术问题,包括CT、SFT、RL等多个阶段,覆盖性能、资源、调度、平台化等能力; 4、与公司各算法部门深度合作,分析业务性能瓶颈,通过软硬结合的方式,高效部署与优化核心业务模型,落地到电商各产品线,投入AI工具链开发及技术生态的建设,支撑电商AI方向重要业务的发展。
1、负责大模型、AIGC服务链路和应用平台的开发,支撑相关业务的生产与高效迭代; 2、设计和实现机器学习相关的基础设施、框架、工具链等,并推动落地到业务中; 3、负责大规模样本数据的管理、标注、预处理、存储等能力建设,提供训练和推理使用的基础设施保障; 4、构建适合电商场景的AI应用Workflow编排框架和平台,方便电商各业务搭建AI应用链路; 5、负责电商GPU资源管理和优化调度,并建设管理工具平台,优化GPU管理效率,提升资源池整体利用率; 6、探索业界前沿的深度学习相关技术,持续提升平台能力、降低研发与算法的使用成本。
关于我们: AI Business 成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于大模型技术能力建设和 AI 原生应用和产品的打造,旨在用最先进的 AI 技术重塑平台竞争力,为商家和用户带来极致电商体验。 作为跨境电商领域的 AI 先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对 AI 领域人才的培养和发展。我们已经汇聚了业内顶尖的 AI 算法专家、AI 工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的 AI 人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 职位描述: 1、负责多语言大语言模型(LLM)的预训练、微调及优化,探索高效训练策略(如低资源语种能力迁移、任务调度优化等),提升模型性能与跨文化场景适应性; 2、构建多模态大模型技术体系,包括图文生成、视频内容生成、多模态检索与信息抽取,支持商品虚拟试穿、智能客服等业务场景。 3、推动大模型与业务深度融合,开发基于LLM的对话系统、Agent产品及RAG系统,优化电商文本生成、跨语言信息匹配、时间序列预测等场景的智能决策能力; 4、设计强化学习对齐算法(如RLHF/DPO),提升模型在垂直领域(如商品推荐、用户交互)的精准度与可控性。 4、实现大模型的高效推理部署,包括模型压缩量化、GPU并行计算优化(如CUDA加速),确保高并发场景下的服务稳定性; 5、探索生成式AI与电商场景结合的前沿技术(如AIGC内容生成、多模态商品检索),推动技术规模化落地。
商品基础算法团队是淘天集团核心的商品理解中台,负责对淘天全域(淘宝、天猫等)数百亿的商品进行深度、精准、多维度的内容理解。我们产出的商品认知能力(如属性、卖点、风格、品类、知识),是整个淘天搜索、推荐、广告、AIGC应用、智能导购、直播等所有核心业务的基石,直接决定了用户“逛”和“买”的体验,是连接“人”与“货”的智能引擎。 当前,我们正处在用新一代AI技术(大模型、多模态大模型)彻底重塑商品世界的历史机遇期。在这里,你将接触到全球最丰富、最复杂的电商多模态数据,有机会定义下一代商品理解的技术范式,你的工作成果将通过集团各大业务场景,影响亿万用户的消费决策。 岗位职责: 1. 构建业界领先的商品多模态理解体系: 负责利用大语言模型(LLM)及视觉语言模型(VLM)等前沿技术,对商品的多模态内容(文本标题、详情描述、图片、视频等)进行深度解析,完成高质量的标签抽取、卖点挖掘、风格识别、需求理解等核心任务。 2. 探索大模型背景下的下一代商品知识库的构建范式:如何从海量商品信息、用户评论、行业知识中自动化构建知识体系?如何解决知识的事实性问题?如何在庞大、有噪声的知识库中抽取有效知识,用于下游落地和应用 3. 负责大模型/多模态模型的前沿技术探索与落地: 跟踪并实践领域内前沿的模型和技术(如模型Fine-tuning, RAG, In-Context Learning, Agent, Model Distillation等),结合业务场景进行技术选型、方案设计与模型优化,解决从训练到部署全链路的挑战,实现技术创新与业务效果的双赢。 4. 设计和优化算法架构与系统: 负责商品理解算法系统的整体架构设计与持续迭代,保证系统的高性能、高可用和高扩展性,以应对淘天集团海量数据的挑战。 5. 驱动技术创新转化为业务价值: 深入理解业务,主动挖掘技术能创造价值的场景,与产品、工程团队紧密协作,通过严谨的AB实验验证算法效果,用技术力量持续驱动业务指标增长。