百度深度学习技术平台部_视觉方向技术产品实习生(J47617)
任职要求
-本科及以上学历,熟悉Python等至少一门脚本语言,有AI相关产品实习或者学习经验优先 -熟悉深度学习基础理论及其应用,掌握GitHub的使用,使用过深度学习框架(PaddlePaddle等) -乐于并善于进行对外沟通协同工作,尤其对产业项目落地有较强兴趣 -了解AI开发者使用需求,注重用户体验 -思维逻辑清晰、善于思考,具备良好的数据分析能力、沟通能力和表达能力 -具备出色的执行力、自驱力及较强的抗压能力
工作职责
-参与深度学习视觉方向开发套件相关功能模块规划,协助完成产品方案设计 -针对图像分类、检测、分割等技术,辅助研发团队构建算法库、撰写文档、制作产品Demo -与产品、开发、运营多团队沟通,优化用户体验,推动产品上线 -定期监控竞品动态、设计用户调研问卷并进行深访,获取用户认知并辅助完成产品迭代优化 -扩展企业应用场景及开发者生态,组织技术宣传及企业开发者拓展活动
【职位描述】 我们是小红书安全风控平台部/算法策略组/内容安全组,目前专注于多模态大模型在多模态理解和内容安全场景的技术落地和产品预研,目前在相关数据&技术方向有一定的积累,并将长期持续投入。我们希望寻求优秀在读硕士生/博士生共同突破大模型在安全审核行业落地的技术挑战,作为实习生,你将有机会与产品、工程紧密合作,将研究算法应用到实际问题中,并解决有难度有价值的问题,促进领域前沿技术的发展。欢迎投递简历。该岗位的核心研究方向包括但不限于: 1. 基础多模态表征:主要研究小红书多模态数据(笔记)下的基础多模态表征工作,包括层次化表征、特征融合、自监督探索等,作为基础模型,支持多样化检索场景。 2. 通用多模态大模型:通用多模态大模型在安全领域理解相关研究,包括高效微调、多模态理解等。建立安全多模态基础模型。
-负责小度多模态大模型的结构设计、预训练任务、模型训练和推理验证等工作,包括但不限于多模态预训练、跨模态生成与检索、多模态对话等业务应用 -跟踪多模态大模型方向前沿问题的研究 -参与建设并持续保持部门多模态技术在业界的技术先进性,保持创新的同时将业界SOTA模型在小度业务场景进行产品化落地 -负责的多模态技术涵盖视觉、语音、NLP等多个领域
菜鸟平台人工智能部致力于探索前沿AI技术在产业互联网的落地与应用: 1、算法研发: 参与建设大模型、多模态、文档理解、AI Agent、知识图谱,强化学习等人工智能技术与行业领域模型的深度融合,实现相关产品的创新与升级。 2、算法应用:参与建设相关技术在业务场景的落地,包括但不限于知识库问答、客服智能、语音智能、数据智能、文档智能、MultiAgent等; 3、深入跟踪调研大模型以及相关方向(包括但不限于NLP/CV/多模态/Agent/具身智能)的前沿技术。