小米搜索算法工程师实习生
任职要求
1. 计算机及相关专业,实习时间3个月以上,每周4天以上 2. 具备良好的编码能力,熟悉数据处理和算法优化,有SQL/Spark 经验更佳 3. 熟练掌握基础机器学习知识,对2-3种模型有较深的认识 4. 熟悉 PyTorch/TensorFlow 等深度学习框架,有大模型训练或微调经验者优先
工作职责
岗位描述: 1、参与小爱内容垂类(音乐/视频等)的搜索推荐算法优化工作, 使用 机器学习 / 多模态 / 大模型 等技术 解决 内容理解 / 搜索排序等问题,参与大模型在搜索推荐场景的微调与优化,提升模型在查询理解和跨模态信息融合对齐任务上的性能。 2、负责搜索推荐效果的改进,分析数据,落地到数据、算法、策略层,最终改进搜索推荐效果。
1. 跟进多模态大模型(vLLM)预训练、SFT、RLHF等技术,调研与跟进最新进展;负责多模态相关性大模型、多模态大模型稀疏检索和稠密模型,多模态大模型个性化预训练方向,以及多模态大语言模型的训练和推理加速; 2. 多模态大模型个性化预训练:研发个性化预训练模型,探索在训练样本、模型参数量等维度上scale-up能带来的收益,研究在电商搜索场景下, CTR和CVR 模型中用户动线特征的挖掘和应用,包括用户行为模型的获取、特征设计、结构优化等个性化建模; 3. 多模态大模型的训练和推理加速:协助研究和开发多模态大语言模型的加速技术,包括但不限于量化、剪枝和蒸馏,以及数据特征和调度优化;实现和优化多模态大模型推理框架,以提高推理速度和效率;与工程团队合作,解决机器学习模型在部署过程中的性能问题; 4. 多模态大模型相关性模型:研发基于多模态大模型的相关性标注和评测大模型,应用到体验实验评测、体验监控、离线数据标注、线上相关性判断等方向; 5.多模态大模型稀疏检索和稠密模型:研究方向包括不限于:电商词表生成、多模态稀疏词表和稠密表征技术、LLMs幻觉缓解等问题。
1、建设小红书推荐、搜索和电商领域算法团队相关的算法工程能力 2、支持大规模算法服务的设计、开发和编排调度,满足在线审核、内容理解等业务需求 3、支持基于LLM的AI能力在小红书问答、客服等多个场景落地
拍立淘是阿里电商核心视觉搜索算法团队,致力于为淘宝搜索核心业务打造行业领先的计算机视觉创新技术,应用于多种电商场景(如拍照搜同款、电商创意AIGC、电商大模型),堪称国内最大的视觉算法应用场景之一。我们紧随技术潮流,不断进行商业和技术创新,期待有志之士的加入,让算法发挥价值,让技术更有影响力。 【招聘方向】 1. AIGC视觉生成(包括但不限于可控图像/视频生成、图像/视频编辑、图像驱动、定制化、试衣等); 2.多模态大模型(包括但不限于大模型预训练、垂域微调SFT、RLHF、数据治理飞轮、训练部署加速等); 3.图像/多模态理解(包括商品多模态理解VG、目标检测、OCR、图像/多模态表征等),其他任何感兴趣/有价值的方向欢迎交流讨论。 【实习工作环境】 1. 充裕的GPU资源,近千张A100/V100 海量业务数据和基础能力积累,帮助高效产出; 2. 来自国内外top学校的师兄/师姐的倾力指导充分尊重实习生个人意见,自由度高; 3. 产研结合,支持鼓励实习生投递顶会论文。