夸克千问C端事业群-千问-数据科学家-推荐场景-杭州
任职要求
1. 专业背景: 计算机、统计学、数学、运筹学或相关专业硕士及以上学历。 2. 算法功底: 扎实的机器学习基础,熟悉推荐系统常用算法(如 DeepFM, Transformer, DIN 等),并对大语言模型(LLM)的基本原理有清晰理解。 3. 工程与工具: 熟练使用 SQL、Python/Scala,具备在庞大的大数据环境(Spark/MaxCompute)下高效处理海量数据的能力。…
工作职责
加入千问APP的核心团队,共同打造下一代AI智能助理,你将负责千问 APP 核心推荐场景(首屏发现流、AI 创作/智能体推荐)以及通用 Agent 的用户行为分析、业务分析与策略优化工作。 1. 通用Agent效果分析:设计合理的通用Agent效果评估体系,降低评估迭代成本,挖掘用户的真实需求和重要改进点,指导下一步优化方向。 2. 用户洞察与行为分析: 通过对用户对话习惯、Agent 使用偏好、创作内容质量的深度挖掘,发现潜在增长点,为算法模型迭代和产品演进提供数据支撑。 3. 核心指标体系构建: 定义并拆解大模型产品的核心指标,建立全链路监控与归因体系,精准量化推荐策略对业务的贡献。 4. 实验与因果推断: 负责大规模 A/B Testing 的方案设计与评估。利用因果推断方法(Causal Inference)识别推荐机制中的关键因子,解决传统策略中“相关性非因果”的痛点。
1. 负责千问用户增长数据科学及洞察,通过探索性数据分析、AB实验、因果分析等手段,输出可落地的业务洞察与策略建议,为产品、运营、投放、算法等团队提供数据支持与决策依据; 2、负责千问用户增长数据挖掘及应用,基于用户行为、投放效果、DMP画像等多源数据,构建并优化用户精细化分层、价值预估、风控算法、投放策略、归因策略、标签建模等算法模型,在业务场景落地,发掘高质量增长的机会,实现用户规模、用户粘性的增长; 3. 负责千问用户数据体系建设,参与数据仓库分层设计与模型建设,设计并维护稳定、高质量的数据链路以及,熟练使用 SQL、Flink、实时数仓等技术构建离线与实时数据工程,推动数据治理体系建设。
1.从拉活的角度,为用户设计个性化的推送策略,通过人工热点+机器个性化资讯推送相结合的手段完成整体push拉活目标 2.根据用户画像、以及用户在端内的行为数据,设计个性化推荐流程(包括但不限于召回/排序等环节),并负责各环节算法模型的迭代工作 3.设计符合用户心智的,综合考虑拉活和负反馈信号(禁用/卸载等)的频控策略 4.针对目前安卓厂商通道流量普遍受限的情况,优化push流量分配策略,提升整体转化
阿里巴巴智能信息事业群,聚焦AI在信息服务赛道的创新应用,从工具到服务,持续为用户提供高效、智能的AI应用。智能信息事业群核心产品为夸克、通义、UC浏览器、书旗小说、超级汇川等,以多产品矩阵,覆盖横跨各年龄段的7亿+用户人群,服务超10万+客户。 如果你想接触和使用先进的机器学习的框架和统计方法设计方案,解决业务中的从未被解决过的问题; 如果你想通过Python/R等流行的语言编写高效的机器学习算法,参与阿里巴巴集团智能信息事业群大数据体系的模型设计、开发、维护,通过元数据、质量体系有效的管理和组织EB级的数据; 如果你想参与阿里巴巴集团智能信息事业群大数据产品的研发,发挥你的商业Sense,通过数据分析和算法来洞察数据背后的机会,来探索大数据商业化,释放大数据的价值; 如果你想接触世界领先的大数据处理与应用的技术和平台,获得大数据浪潮之巅的各类大牛的指导; 那就加入我们吧!
加入千问/夸克APP的核心团队,共同打造下一代AI智能助理的“推荐大脑”。包括但不限于:对话推荐、AI内容创作、内容消费,负责推荐系统的算法设计、优化及落地,通过精准的算法策略提升对话体验与内容分发效率,带动千问/夸克APP的DAU、AI生成内容(AIGC)、创作者生态等核心业务的增长。 1.算法设计与优化:利用前沿技术优化千问/夸克APP的对话推荐、消费和创作模块,全链路地优化包括召回模型、排序模型、多模态推荐、多目标、冷启动,探索等推荐算法和模块; 2.数据驱动迭代:基于用户行为数据、内容特征数据等,构建算法评估体系,通过AB测试等方式验证算法效果,持续迭代优化推荐策略,解决冷启动、多样性不足等实际业务问题。 3.特征工程与模型搭建:利用大模型构建千问/夸克用户的画像,参与内容特征、用户特征的挖掘与构建,结合场景需求选择或改进合适的推荐模型,提升模型预测精度与泛化能力。 4.系统协同与落地:与工程、产品、数据等团队协作,将算法方案转化为可落地的技术实现,保障推荐系统的高可用性、低延迟与稳定性,适配各场景的动态变化需求。 5.技术探索与沉淀:跟踪推荐算法、AI大模型在内容领域的应用动态,探索大模型与推荐系统结合的创新方向,沉淀算法研发经验与技术方案。