快手多模态算法实习生-【内容安全】
任职要求
1、硕士及以上学历,对视觉前沿技术有浓厚兴趣,时刻跟进学术界最新进展,有自己独立的想法和判断,能够快速复现学术界最新成果; 2、编程基础扎实,熟练掌握C++/Python,熟悉Pytorch、TensorFlow等训练框架; 3、对常见的模型结构、建模方法、Loss设计、优化策略、训练过程中的重要tricks等有深入了解和丰富经验; 4、有优秀的逻辑思维能力、数据分析和新知识学习能力,善于分析和解决问题;良好的沟通能力与团队协作能力等。
工作职责
1、对图像、视频、文本等进行深入的语义理解,支持短视频、直播、搜索、推荐、商业化等业务需求; 2、推进视觉相关基础技术研发,如大规模分类、检测、分割、序列识别、人脸、自监督学习、内容生成、模型压缩和优化等; 3、对多模态大模型有基础的了解,可以用目前开源的多模态大模型解决内容安全领域的一系列问题。
- 参与多模态模型(VLM)的内容安全模型的研究与落地,包括数据标注、模型调优及评估; - 协助分析视频/图像中的潜在安全风险,如违规、低俗、欺诈、暴力等; - 参与数据集的构建、清洗与分析,支持模型在内容安全方面的效果改进; - 跟进国内外相关领域的最新进展,参与团队的技术分享与创新工作。
1.深入开展内容安全治理多模态大模型的调研工作,跟踪前沿技术发展趋势,分析不同模型在该场景下的适用性。 2.协助团队进行多模态大模型的训练工作,包括数据预处理、模型搭建、参数调整等,以提升模型在内容审核任务上的准确性和效率。 3.参与模型性能评估,分析实验结果,提出改进方案,优化模型性能。 4.与其他团队成员协作,共同解决在多模态模型应用于内容审核业务过程中遇到的技术问题。
ByteIntern:面向2025届毕业生(2024年9月-2025年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 1、参与电商场景下文本、多模态相关模型能力建设,包括但不限于:基于LLAMA/LLaVA等模型的多模态、关键信息抽取、实体识别、文本分类、知识图谱构建等; 2、参与构建业内领先的内容安全、内容生态识别方法,探索前沿技术(如NLP前沿、多模态前沿的训练和运用相关),并应用落地到电商业务场景中; 3、参与分析模型落地对电商生态的正面影响。
ByteIntern:面向2025届毕业生(2024年9月-2025年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 1、参与电商场景下文本、多模态相关模型能力建设,包括但不限于:基于LLAMA/LLaVA等模型的多模态、关键信息抽取、实体识别、文本分类、知识图谱构建等; 2、参与构建业内领先的内容安全、内容生态识别方法,探索前沿技术(如NLP前沿、多模态前沿的训练和运用相关),并应用落地到电商业务场景中; 3、参与分析模型落地对电商生态的正面影响。