蚂蚁金服蚂蚁集团-多模态数据算法专家-杭州
任职要求
1、本科及以上学历,计算机/软件工程/人工智能等专业背景,具有2年以上多模态大模型研发经验。 2、精通深度学习原理,熟练掌握pytorch框架,具备扎实的编程能力、优秀的架构能力;在多模态大模型、语料合成、数…
工作职责
1、深入理解AI多模态大模型,支撑图像、音频、视频等模态的高质量训练语料构建;包括但不限于基础语料清洗、语料标签化、语料自动评价以及推理类语料合成。 2、构建基于多模态Agent的数据闭环系统,开发面向全模态的语料处理链路,提供稳定、可靠、高效的高质量数据处理能力与语料问题分析能力。 3、跟紧业界前沿大模型技术,复现优质语料合成算法与模型技术框架,支持数据消融与模型效果分析;保障语料交付的可持续性与先进性。
在LLM重构搜索的浪潮中,数据质量决定模型智能的天花板。我们需要你构建数据与模型的「双向进化引擎」,从万亿级多模态数据中提炼认知黄金,驱动大模型突破搜索理解的终极边界! 1. 万亿级网页提炼:研发多模态数据分析框架,通过网页解析、文档智能、知识抽取等技术,完成全网万亿级搜索网页的关键信息提炼。 2. 攻克数据质量理解:设计网页质量/权威性/可信度的多维度评估模型,以及跨模态数据表征技术,提升夸克在网页知识获取的准确性与可靠性。 3. 驱动数据与算法协同进化:探索大模型时代的数据评估方法论,量化数据优化对搜索效果和模型性能的影响。 4. 打造全网优质内容库:构建多模态数据的处理和挑选管线,建立覆盖网页/图文/视频等全域内容的智能知识库。

在LLM重构搜索的浪潮中,数据质量决定模型智能的天花板。我们需要你构建数据与模型的「双向进化引擎」,从万亿级多模态数据中提炼认知黄金,驱动大模型突破搜索理解的终极边界! 1. 万亿级网页提炼:研发多模态数据分析框架,通过网页解析、文档智能、知识抽取等技术,完成全网万亿级搜索网页的关键信息提炼。 2. 攻克数据质量理解:设计网页质量/权威性/可信度的多维度评估模型,以及跨模态数据表征技术,提升夸克在网页知识获取的准确性与可靠性。 3. 驱动数据与算法协同进化:探索大模型时代的数据评估方法论,量化数据优化对搜索效果和模型性能的影响。 4. 打造全网优质内容库:构建多模态数据的处理和挑选管线,建立覆盖网页/图文/视频等全域内容的智能知识库。
1. 针对本地生活消费信贷业务发展需求,负责设计和完善信贷风控算法体系,包括反欺诈、信用评分、价值模型等; 2. 深入了解本地生活消费信贷产品的产品属性、业务场景、客群,识别风险并根据客户的贷前、贷中、贷后的行为表现,结合客户各平台的属性及行为数据,以及平台外各种第三方相关数据,完善风控特征池、引领机器学习算法的创新应用,对获贷及潜在客户的信用风险和欺诈风险进行评估与计量; 3. 根据客户的被量化的风险情况,为客户计算响应的准入门槛、授信额度、价格及对应的还款方式等,并使之实现既定目标上的最优化; 4. 参与和探索前沿算法在信贷智能风险管理领域的应用和落地,包括但不限于知识图谱,GraphML,多模态识别,AutoML等方向; 5. 协同业务及政策团队进行业务问题抽象,推动算法在业务场景中的应用,并持续推动优化算法及性能;
方向一:搜推效率、生成式、店品券 岗位职责: 1、负责搜索/推荐业务的召回、粗排/精排算法设计和优化,提升大盘转化效率; 2、负责用户、商户、query、营销信号等各维度特征、模型样本等基础模块的搭建和优化; 3、应用机器学习/深度学习、生成式推荐等算法技术,优化召回/排序模型,推动生成式推荐算法的工业落地; 4、与上下游的数据、工程、产品等团队紧密配合,把算法模型等上线到业务场景中,提升业务效果; 5、跟进推荐系统前沿研究方向,结合业务场景进行创新与落地,做技术沉淀和paper发表。 方向二:大混排(统一混排)、全站推 岗位职责: 1、负责混排(信息流+商业化)算法的设计和优化,提升流量变现效率和用户体验; 2、建立并优化目标函数,通过混排多目标优化平衡用户体验 & 平台收益; 3、结合用户画像、内容特征、广告属性等多维度信号,构建高效的特征工程与模型; 4、应用深度学习、强化学习等技术优化推荐与广告混排效果; 5、与工程、产品、运营团队密切协作,将算法落地到生产环境,并持续监控与优化效果; 6、跟踪前沿的推荐与广告算法研究,推动新技术在业务中的应用。