阿里巴巴未来生活实验室-搜推大模型和机制策略算法(拍立淘)-北京/杭州
任职要求
1、计算机视觉和深度学习等相关专业,本科/硕士/博士; 2、具备扎实的计算机视觉/机器学习/深度学习理论功底和算法经验,或者在该领域有优秀的学术成果 (例如,主流会议WWW/KDD/ICML/NeurIPS/ICLR等,发表过一作论文); 3、在计算机视觉领域有高影响力成果者优先, 例如,高引论文,或者行业影响力比赛 (第1名), 或者优秀开源贡献者; 4、有利用视觉/深度学习创新技术解决行业难题,并带来大幅业务增长者优先; 5、熟练使用C/C++、Python其中一种开发语言; 6、有很强的创新能力,能够解决高挑战性问题,自我驱动能力强,并且有独立完成任务的能力;同时,具有良好的沟通技能和抗压能力。
工作职责
拍立淘是淘天top1的AI原生产品(DAU 数千万),同款搜索产品体验和用户日活均为行业top1,目前从淘宝搜索独立出来,向更广阔的技术应用(如多模态理解,vLLM增强的搜索推荐)发展,冲击1亿DAU。团队工作氛围良好,技术实力突出,已在top AI会议如ECCV、WWW上发表多篇论文,在这里不但能追踪前沿的算法技术,也能将其进行实践应用落地,获得真实用户反馈,产生业务价值。 职位描述 1. 搜推大模型方向:负责大模型相关技术,SFT,RLHF等在图搜场景下搜索推荐业务的落地,包括用户偏好对齐,可解释推荐系统,精排CTR/CVR预估 2. 排序机制策略方向:负责拍立淘的搜索/推荐的重排,机制与策略设计
阿里资产技术团队负责建设全球领先的网络资产处置平台,承载司法拍卖、破产处置、珍品交易等多个市场体量巨大的业务,应对海量用户、巨量资金带来的复杂大型互联网系统架构。 1. 复杂场景下的智能算法构建: ○ 负责商品拍卖场景的搜索推荐系统优化,包括基于用户行为的长短期兴趣建模,设计多目标排序策略(精准推荐/惊喜度平衡),解决新品冷启动、多样性打散等业务难题; ○ 构建亿级商品知识体系,研发基于大模型的商品结构化分析、同品识别、属性纠错等多模态商品分析解决方案; ○ 开发基于时序特征的成交价与拍下率预测系统,提升拍卖定价策略的合理性。 2. 前沿算法探索和落地,LLM/GNN/多模态等前沿技术在搜推场景的应用落地,包括: ○ 基于用户意图理解的生成式推荐范式; ○ 图神经网络在异构图谱中的关系挖掘; ○ 基于大模型的知识增强的多模态商品表征。 3. 算法数据闭环建设: ○ 设计科学的效果评估体系,构建AB实验、因果推断与归因分析的全链路验证机制; ○ 推动算法成果转化为关键业务指标的提升(GMV/LTV/用户时长等)。 我们提供: ○ 参与核心系统的架构设计机会; ○ 行业领先的GPU算力集群与数据资源支持; ○ 与顶尖算法团队共同探索搜索推荐技术前沿领域的创新突破。
团队介绍:我们是支持抖音集团广告业务算法技术中台团队Ads Core,致力于研发全球领先的在线广告优化算法,营造健康、互惠的广告生态,持续提升用户和客户体验,引领并推动行业算法的变革与创新。我们承担了抖音集团产品广告变现业务的基础算法策略和机制的改进与研究,涵盖抖音、今日头条、番茄小说等场景的商业化技术的支撑。 课题介绍: 广告推荐算法是互联网商业变现的核心驱动力,我们希望借鉴生成式AI的成功思路,探索在广告推荐算法和架构上的颠覆性创新,解锁更大的算法效果提升空间。重点探索以下方向: 1)基于类Transformer结构的生成式推荐大模型技术,验证广告推荐场景的Scaling Law,探索面向大模型的特征工程以及算法建模范式; 2)算法和工程协同设计与优化,提升海量数据、超大参数背景下的训练与推理效率; 3)语言/多模态模型和推荐模型的结合; 1、负责商业化场景推荐大模型的算法优化,引入生成式AI技术,优化算法建模方法、模型结构、特征和样本等,提升广告变现效率; 2、验证推荐大模型的Scaling Law,应对大模型训练中的一切新挑战; 3、算法和工程高度融合、协同设计,极致优化推荐大模型的训练及推理效率。
1、负责搜索推荐系统的算法设计与优化,提升用户搜索和推荐的精准度与满意度。 2、研究和应用深度学习、强化学习、大模型等技术,优化算法包括但不限于,个性化召回&排序算法、全链路策略机制算法、Query理解和商品相关性优化。 3、参与系统架构设计,确保算法在大规模数据和搜推多场景下有效。 4、与产品和数据团队紧密合作,通过数据驱动优化业务策略和算法模型,解决关键业务问题,提升用户转化和留存。 5、跟踪业界最新技术动态,推动搜推技术的创新和应用。
我们作为穿山甲广告Ranking团队,团队使命是充分结合网盟场景,夯实基础算法和机制策略能力,同时面向未来,基于大模型等新技术重塑投放链路,不断突破广告变现效率天花板;base北京/上海/杭州。 1、提升投放链路效率,包括算力/召回/粗排/精排/Calibration以及漏斗一致性框架等全链路优化; 2、夯实海量数据下的基础算法能力,包括超长序列/大规模图网络/大规模异构场景建模等; 3、创新应用和前沿算法落地,包括LLM based Recsys、强化学习出价竞价等; 4、持续提升投放生态水平,提供冷启动/稳定性等长期问题的产品化解决方案; 5、针对nobid/托管预算等自动化投放场景,利用模型/运筹优化不断提升跑量和前后端ROI。