小红书算法实习生-电商广告
任职要求
1. 扎实的编程和开发功底(熟练Python、Java、SQL),具备快速落地项目的能力; 2. 较好的学习能力,能够快速理解业务和算法; 3. 熟悉机器学习、自然语言处理、计算机视觉、语音识别与合成中一项或多项,有机器学习/数据挖掘/人工智能相关领域会议论文(KDD/WWW/NIPS/ICML/CVPR/ACL/AAAI...)者优先,有机器学习/数据挖掘/CV/NLP等相关比赛经历者优先;
工作职责
1、支持小红书电商广告业务快速发展,完成相关技术问题解决; 2、利用大规模机器学习算法对点击率/转化率/GMV等模型进行深入优化 3、研究和优化广告召回,出价算法,排序机制等算法模块 4、对商家、用户、达人行为做深入的理解和分析,制定针对性的算法提升商家营销效率 5、持续学习,时刻跟进与探索前沿技术并应用在真实业务场景
团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 课题介绍: 电商推荐算法是互联网商业变现的核心驱动力,目前我们有国内最大的兴趣电商分发场景以及最大的电商广告分发场景,我们希望借鉴生成式AI的成功思路,探索在电商推荐算法和架构上的颠覆性创新,解锁更大的算法效果提升空间。重点探索以下方向: 1)基于类Transformer结构的生成式推荐大模型技术,验证电商推荐场景的Scaling Law,探索面向大模型的特征工程以及算法建模范式; 2)研究电商推荐模态下的Tokenization以及COT相关算法优化; 3)算法和工程协同设计与优化,提升海量数据、超大参数背景下的训练与推理效率; 4)语言/推荐/视频等多模态模型的结合。 1、负责电商推荐及电商广告场景推荐大模型的算法优化,引入生成式AI技术,优化算法建模方法、模型结构、特征和样本等,提升电商分发效率; 2、验证推荐大模型的Scaling Law,应对大模型训练中的一切新挑战; 3、挖掘有效的用户行为,不限于Sideinfo、Action_Type等,同时研究行为聚合算法; 4、算法和工程高度融合、协同设计,极致优化推荐大模型的训练及推理效率。
团队介绍:Data-电商团队,负责电商创新项目的算法和大数据工作。依托于字节跳动产品,帮助用户发现并获得好物,享受美好生活。在这个团队,我们不仅要通过推荐和搜索算法帮助用户买到感兴趣的好东西,也要通过风控算法和智能平台治理算法去甄别违规行为,保护用户的购物体验;我们还要建设智能客服技术、大规模商品知识图谱来提升各个交易环节的效率;我们也要结合机器学习和运筹算法,来优化供应链和物流的效率和成本,并进一步提升用户体验;另外我们还会用人工智能来帮助商家提升经营能力。我们的使命:没有难卖的优价好物,让美好生活触手可得。 课题介绍: 电商推荐算法是互联网商业变现的核心驱动力,目前我们有国内最大的兴趣电商分发场景以及最大的电商广告分发场景,我们希望借鉴生成式AI的成功思路,探索在电商推荐算法和架构上的颠覆性创新,解锁更大的算法效果提升空间。重点探索以下方向: 1)基于类Transformer结构的生成式推荐大模型技术,验证电商推荐场景的Scaling Law,探索面向大模型的特征工程以及算法建模范式; 2)研究电商推荐模态下的Tokenization以及COT相关算法优化; 3)算法和工程协同设计与优化,提升海量数据、超大参数背景下的训练与推理效率; 4)语言/推荐/视频等多模态模型的结合。 1、负责电商推荐及电商广告场景推荐大模型的算法优化,引入生成式AI技术,优化算法建模方法、模型结构、特征和样本等,提升电商分发效率; 2、验证推荐大模型的Scaling Law,应对大模型训练中的一切新挑战; 3、挖掘有效的用户行为,不限于Sideinfo、Action_Type等,同时研究行为聚合算法; 4、算法和工程高度融合、协同设计,极致优化推荐大模型的训练及推理效率。
1、出价模型化:搭建广告投放模拟环境,构造智能出价agent算法,开发并评估不同技术选型(MPC、强化学习、生成式)的最佳方案,迭代业界先进经验沉淀paper; 2、端到端延迟建模:电商广告长周期归因场景下,针对回流延迟建设端到端预估模型,包括特殊应用场景大促活动下的时间序列建模,提升广告投放效率; 3、冷启动:研究和优化广告召回、出价算法、排序机制等算法模块,解决客户投放冷启问题,围绕生成式推荐、跨域数据利用、多模态信息进行深度优化探索。