快手大模型应用算法实习生-【电商】
任职要求
1、具备机器学习基础和工程化能力,包括机器学习、深度学习、强化学习。实操利用SFT、RLHF等技术有项目应用经验优先; 2、熟练掌握Python,JAVA等至少一门语言,掌握Tensorflow、Pytorch等至少一个深度学习框架; 3、具有NLP或垂直行业大模型Pre-train、Finetune、Inference等优化经验; 4、有大模型开源项目、电商应用场景实操经验者优先。
工作职责
1、负责电商侧垂类大模型的相关研发和应用,深入挖掘垂直行业、开源以及电商的海量数据,构建电商知识库,研究前沿大模型训练和优化方法,助力电商行业特性打造可控的垂类模型能力; 2、支持电商领域的大模型时代下的新型AI产品,提升电商行业场景的用户体验和效率,打造AI时代的电商新应用; 3、研究和跟踪前沿技术发展,探索AI助力电商业务发展的新范式。
1、负责通过基于大语言模型及多模态大模型的微调、prompts调优、指令构建及演化技术,将大模型的生成、理解、交互能力在公司核心业务场景应用落地,包括但不限于AIGC创意生成、视频处理、智能化特效、智能对话、代码生成、音视频传输、电商场景内容理解等; 2、负责LLM及多模态大模型的应用中台及相关技术模块搭建,包括但不限于Agents 、RAG、 function call、system prompts等,探索大模型应用前沿及新兴应用场景; 3、跟踪行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践; 4、了解业务,与公司各技术团队密切配合,能与产品、运营等角色高效沟通需求和目标,发挥自己的主观能动性,设计技术解决方案,培养自己的良好的业务sense和综合素质。
1. 结合业务进行前沿技术探索并发表论文; 2. 探索并搭建多智能体对话系统,提升用户在电商应用中的对话体验和陪伴互动; 3. 协助优化现有系统架构,提出改进方案,提高系统整体效能及用户体验; 4. 与团队成员紧密合作,确保各技术模块能够无缝集成到现有产品中。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-知识图谱团队,通过实体挖掘、关系抽取、知识融合等技术手段,将海量的非结构化文本进行结构化建模,构建起了大规模的电商知识图谱,支持电商业务的发展;同时,结构化的电商知识也能融入大规模的预训练模型,进一步提升在各个下游任务上的性能。我们利用这些前沿的NLP技术落地到图谱构建和下游的多个业务场景:商品/短视频分类和属性识别、评价情感分析、短标题生成等。此外,为支持国际化电商业务发展,在多语言、低资源等诸多新挑战下,我们积极探索利用跨语言迁移提升目标语言的模型、利用知识迁移去缓解低资源场景下的标注数据稀缺难点等课题,助力国际化电商知识图谱的快速建设,为业务的蓬勃发展提供助力。 1、构建和维护高质量的电商行业文本和多模态数据集,不断优化数据质量和丰富度,沉淀电商行业的高价值信息; 2、针对业务需求进行电商行业LLM和多模态LLM的继续训练(CT)、有监督微调(SFT),提升模型在电商场景下的表现; 3、制定和实施LLM的评估方案,结合人工评估和自动化评估手段,确保模型性能的可靠性和稳定性; 4、通过LLM不断优化针对电商场景人货场的理解和生成能力,包括:商品信息识别、视频内容理解、用户兴趣挖掘、商品文案生成、导购素材生成等等; 5、通过LLM和上述能力,支持电商各种业务场景,包括:搜索、推荐、导购、评价、商品发布等等,提升各场景的业务效果。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商-知识图谱团队,通过实体挖掘、关系抽取、知识融合等技术手段,将海量的非结构化文本进行结构化建模,构建起了大规模的电商知识图谱,支持电商业务的发展;同时,结构化的电商知识也能融入大规模的预训练模型,进一步提升在各个下游任务上的性能。我们利用这些前沿的NLP技术落地到图谱构建和下游的多个业务场景:商品/短视频分类和属性识别、评价情感分析、短标题生成等。此外,为支持国际化电商业务发展,在多语言、低资源等诸多新挑战下,我们积极探索利用跨语言迁移提升目标语言的模型、利用知识迁移去缓解低资源场景下的标注数据稀缺难点等课题,助力国际化电商知识图谱的快速建设,为业务的蓬勃发展提供助力。 1、构建和维护高质量的电商行业文本和多模态数据集,不断优化数据质量和丰富度,沉淀电商行业的高价值信息; 2、针对业务需求进行电商行业LLM和多模态LLM的继续训练(CT)、有监督微调(SFT),提升模型在电商场景下的表现; 3、制定和实施LLM的评估方案,结合人工评估和自动化评估手段,确保模型性能的可靠性和稳定性; 4、通过LLM不断优化针对电商场景人货场的理解和生成能力,包括:商品信息识别、视频内容理解、用户兴趣挖掘、商品文案生成、导购素材生成等等; 5、通过LLM和上述能力,支持电商各种业务场景,包括:搜索、推荐、导购、评价、商品发布等等,提升各场景的业务效果。