阿里巴巴研究型实习生-阿里妈妈-大模型生成式推荐技术研究实习生
任职要求
1. 自然语言处理、机器学习、数据挖掘、人工智能等相关专业的硕士生/博士生; 2. 熟练掌握Tensorflow、Pytorch等深度学习框架,扎实的编程基础,具备独立的算法实现能力; 3. 有…
工作职责
1. 跟进和研发大规模语言模型(LLM)的预训练、持续训练、SFT、RLHF 等技术。 2. 研发基于大模型的生成式召回、广告点击率预估、用户搜索词理解等下游应用。 3. 结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。
-协助长视频推荐算法设计与优化,深入理解各场景业务和机器学习技术,优化模型、策略,提升用户观看体验与留存; -协助搭建行业顶尖的推荐系统,将最前沿的机器学习技术应用落地,促进业务发展; -通过多目标学习、多场景共享建模与迁移学习、流量分发机制设计、生成式推荐等,结合业务的实际问题做好技术探索和研究; -和产品、运营团队紧密合作,通过对产品和用户的深入理解和分析,制定算法策略促进内容生态健康发展。
1. 负责美团首页猜喜推荐排序算法的研发工作,设计和优化推荐算法模型,提高系统的推荐效果和用户体验; 2. 负责开发和维护推荐系统,包括数据采集、数据处理、特征工程等模块的开发和优化; 3. 参与团队技术讨论,提供技术解决方案和技术支持; 4. 跟踪行业发展动态,在美团场景下落地生成式推荐,不断提升团队的技术能力和创新能力。
【业务介绍】 作为公司统一的模型训练引擎团队,支撑公司内所有搜推广类业务的训练工程侧工作,包括模型训练、参数服务器、特征样本流水线等,通过引擎能力的持续建设结合多元异构算力为业务提供高效、灵活、稳定的搜广推模型服务。 你将专注于大规模AI训练系统最核心的性能优化赛道,直面千亿参数模型训练中的效率瓶颈,解决工业级AI系统在性能与规模上面临的真实挑战。 【岗位职责】 1、深入参与GPU异构计算栈的研发与调优,从算子、内存、通信多维度挖掘硬件极限性能;通过CUDA编程、内核融合、混合精度训练、通信与计算重叠等高级优化技术,不断提升训练引擎效率。 2、推动自动化扩展、智能资源调度、跨架构设备兼容(NV GPU、GPGPU、XPU等)、AI系统可观测性等先进技术在公司模型训练平台落地; 3、跟踪并推动AI系统领域的最新技术趋势(如生成式推荐、AI编译优化、RDMA/NCCL通信计算并发等),持续保持平台业界领先优势。
