阿里巴巴阿里妈妈-广告大模型算法工程师(预估方向)-北京
任职要求
1、计算机、数学或统计学相关专业硕士及以上学历; 2、熟练掌握Java/C++/Python中至少一门语言,有扎实的数据结构和算法基础; 3、熟悉常用的机器学习算法; 4、具备优秀的分析和解决问题的能力,良好的沟通协作能力; 5、有大模型、数据挖掘、机器学习、强化学习、信息检索、自然语言理解、推荐系统、计算广告学及算法博…
工作职责
1、探索生成式预估范式在搜索推荐场景的可行性与边界,系统分析生成式模型相较于传统判别式模型在表达能力、泛化性与训练效率上的优劣;设计可扩展的生成式架构,涵盖生成式训练范式、结构优化、以及基于强化学习的排序目标对齐方法,构建具备scale-up潜力的下一代预估模型体系。 2、研究大语言模型(LLM)在电商场景下的个性化CTR/CVR预估应用,探索模态对齐、用户行为链(CoT)建模等技术路径,将LLM的推理能力迁移至用户偏好理解与意图推断,实现更精准的人货匹配与动态兴趣建模。 3、主导大模型预估系统的基础设施建设,涵盖算力友好的算法设计、分布式训练加速、线上低延迟部署、端到端链路优化及计算复杂度控制,推动前沿模型技术在高并发、实时性要求严苛的工业场景中规模化落地。
1. 优化多国家、多场景、多目标的推荐预估模型提升推荐效果,包括不限于数据分析、模型开发、模型上线,针对具体问题的模型设计和开发,模型最终上线和部署; 2. 结合海量的用户行为数据、场景多场景数据和商品供给数据等进行深入分析,持续挖掘预估算法提效的机会点; 3. 针对特定问题能进行定制化的模型优化,同时负责模型部署和实验部署,拿到最终业务结果; 4. 关注推荐系统领域最新研究成果和技术动态,引入适合业务场景的前沿算法。
团队介绍: 我们是小红书基础模型组,负责公司核心场域的预估模型建设,我们通过序列建模、跨域学习,亦或者是寻求突破常规的生成式推荐,提升模型预估能力。我们不再受限于单场域数据,而是打通场域间的模型算法并结合业务特性,力求用技术突破边际效益,寻求大模型时代下搜广推的更多可能。如果你热爱技术,期待在小红书中用技术解决复杂业务挑战,欢迎加入构建小红书的新一代模型体系,共同探索无限可能! 🚀 工作职责 针对小红书站内的推荐/广告排序模型进行全方位基础组件迭代,包含了模型的序列建模,跨场域信息利用,Scaling Up等等技术,参与召粗精全链路的算法设计,提升小红书首页推荐的核心体验2.指标以及广告收入。具体工作职责和技术点包括以下: 1.多域信息建设:建设全场域的序列特征服务,包含信息流,搜索,商业化等多个场景; 2.序列建模技术:深入探索长短期兴趣序列建模技术,结合业务理解 + 长序列技术做通用化 长序列end to end兴趣挖掘模块; 3.跨场域模型:对业务深入了解,具备横向能力,设计高效的跨场域模型,利用全场域稠密行为解决稀疏场域预估不准确问题; 4.模型Scaling Up:依托LLM架构,设计和实现下一代高效的排序模型范式,包含模型Scaling Up验证以及高效交叉模块; 5.工程协同:与数据平台、工程团队合作,实现模型的高效分布式训练、部署和服务化(TensorFlow/PyTorch),同时编写高质量的技术文档,分享技术成果和知识。
【课题说明】 传统销售模式中,销售人员通过电销系统触达商户,对商户进行营销/运营触达,整体链路人工依赖率高。随着大模型技术的快速发展,基于大模型的智能外呼在提升电销覆盖率和转化率方面展现出极大潜力。 本课题致力于将大模型技术和智能外呼任务相结合,优化美团智能外呼系统,增强其在复杂对话环境下的意图理解与灵活应对能力。力图实现更自然的语音交互、更精准的营销策略,以及更灵活的应答处理等。 【建议研究方向】 1.转化信号奖励建模:依托业务场景多轮对话的真实转化信号,构建商家画像、对话文本特征信号以及交互环境特征,预估对话的转化率,进而通过强化学习(DPO/GRPO/RLHF)引导模型营销话术生成。 2.销售领域垂类大模型:通过收集多场景销售数据以及美团广告产品知识,通过continue-Pretraining构建垂类通用销售模型基座,支持多业务场景快速支持应用。 3.Multi-Agent交互式外呼系统:通过构建任务规划、流程监督、对话营销等多个agent交互逻辑,在较低响应耗时条件下,实现最佳的电话沟通效果。