字节跳动电商多模态大模型算法实习生-电商业务
任职要求
1、2026届硕士及以上学位在读,计算机相关专业; 2、扎实的深度学习技术基础,有CV/NLP/多模态相关的项目经验,发表过高水平学术会议论文或者有竞赛经验者优先; 3、熟练掌握Python/C++等至少一门编程语言;熟练Pytorch训练框架;熟悉Hunggingface-Transfo…
工作职责
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 1、大模型算法研发:构建电商领域的大模型LLM底座,融合电商的知识,快速落地电商业务,例如:沉淀电商大模型预训练链路,研发电商NLP大模型,或者研发电商图文或者视频多模态大模型; 2、基础算法研发:持续建设和深耕NLP/CV/多模态基础预训练算法(BERT类算法),例如:沉淀&优化电商场景的预训练模型,包括超长文本/口语文本预训练,电商图片/视频自监督,适配电商商品的多模态表征学习等; 3、梳理&沉淀算法库,抽象算法接口,最大化提高算法/预训练模型的复用率,同时优化数据采集&模型训练&部署&推理的流程,提升研发效率; 4、技术输出:定期分享SOTA模型,赋能电商甚至公司级别的业务BU,沉淀专利和论文。
1.负责评论维度方向模型的训练和基础系统性能的优化 2.利用自然语言,多模态等技术,从海量内容中识别风险用户与内容 3.跟踪行业最新动态,推进新算法的落地与应用
1、拥抱大模型技术,改进当前内容理解和用户行为理解技术的范式,应用到小红书电商风控&治理场景来解决实际业务问题; 2、进行大模型前沿技术探索和研发,发表国际顶级论文 3、参与大模型相关的业务落地,包括但不限于直播图文信息抽取、文本&用户行为理解、视频结构化、消费者和商家画像、信息抽取、智能摘要、意图理解等;
支持公司内容安全、业务风控、信息安全的平台建设和风险管理工作。通过AI算法、大数据、情报攻防和终端安全灯多领域交叉技术建设安全风控平台,为数亿小红书用户提供安全健康的社区环境,同时保障电商、直播等业务的健康发展 1.负责用户维度方向模型的训练和基础系统性能的优化 2.利用计算机视觉,自然语言,多模态等技术,从海量内容中识别风险用户与内容 3.跟踪行业最新动态,推进新算法的落地与应用
1、负责通过基于大语言模型及多模态大模型的微调、prompts调优、指令构建及演化技术,将大模型的生成、理解、交互能力在公司核心业务场景应用落地,包括但不限于AIGC创意生成、视频处理、智能化特效、智能对话、代码生成、音视频传输、电商场景内容理解等; 2、负责LLM及多模态大模型的应用中台及相关技术模块搭建,包括但不限于Agents 、RAG、 function call、system prompts等,探索大模型应用前沿及新兴应用场景; 3、跟踪行业及大模型技术发展,结合业界前沿技术和业务需求,打造大模型应用的最佳实践; 4、了解业务,与公司各技术团队密切配合,能与产品、运营等角色高效沟通需求和目标,发挥自己的主观能动性,设计技术解决方案,培养自己的良好的业务sense和综合素质。