蚂蚁金服蚂蚁集团-算法工程师-多源异构预训练/用户表征
任职要求
1. 具备出色的问题分析和解决能力,自我驱动,并具备较强的学习能力、创新应用能力和沟通协调能力。 2. 精通NLP、多模态领域关键算法技术,熟悉大模型相关技术应用 3. 拥有计算机科学、电子工程、数理统计或其他STEM相关专业的学术背景,具备扎实的机器学习和深度学习基础; 4. 熟练掌握PyTo…
工作职责
1、负责建设风控场景大规模预训练模型,结合LLM技术发展,探索面向风控场景的Tokenization、Scaling Law等技术方向 2、参与亿级用户的信贷逾期&保险定价的算法优化,创新传统金融风控领域建模范式,用技术变革带来新的业务增长空间 3、协同跨团队技术和业务同学共同推动项目达成技术和业务目标。
1. 参与淘天物流全链路智能化质控体系构建,打造通用物流质控AI Agent,持续提升订单履约质量与消费者体验; 2. 基于淘天海量数据,深入分析物流全链路异常与对抗行为(如虚假发货、轨迹伪造、黑灰产等),识别关键问题与治理机会; 3. 设计并实现物流场景下的机器学习、深度学习及多模态质控算法,针对典型异常模式开发高精度识别算法与治理方案; 4. 构建高质量、多模态物流质控数据体系,融合文本、图像、语音、行为序列及时空轨迹等多源异构数据,为模型提供可靠的数据基础; 5. 研发物流场景下的智能质控基座大模型,通过领域自适应预训练与精细化微调,提升大模型对物流异常模式与对抗行为的深度理解能力。
1. 负责小鹏汽车“扶摇”AI平台数据处理相关的软件开发工作,包括数据加载工具(XDataLoader)和数据集管理平台(XDataset),提供统一的数据加载、转换、缓存与预取能力;目标解决大规模数据加载过程中出现的性能瓶颈、数据一致性、系统稳定性等问题,服务AI大模型的训练和推理; 2. 开发并维护高性能 DataLoader SDK,支持自定义采样、并行读取、缓存预取与数据增强等功能,优化多线程/进程流水线,降低I/O与预处理延迟,简化算法团队接入并提升加载效率; 3. 搭建通用Dataset管理系统,实现多源异构数据(图片、视频、点云、传感器等)的统一接入、解析与格式化; 4. 协同算法团队及其他技术团队,深入理解业务需求,快速响应并落地实现。
1. 深入理解滴滴海外业务模式、流程和系统架构,和相关产品技术、业务运营高效沟通,设计合理的数据仓库架构。 2. 充分利用滴滴现有的各种数据仓库及反作弊处理平台,设计、开发和维护高效、可扩展的大数据处理系统,以支持安全反作弊业务的数据驱动决策和业务发展。设计并优化离线/实时数仓模型(如 ODS、DWD、DWS、ADS 分层),支持实时报表、监控和风控等场景。 3. 对多源异构数据(日志、事件消息、API、爬虫数据等)进行清洗、解析和结构化处理,提取关键业务信息。解决数据清洗中的 脏数据、格式混乱、缺失值、重复数据 等问题,提升数据质量。与数据开发、算法、业务团队协作,理解需求并构建高效的数据处理流程。 4. 跟踪大数据领域的新技术、新工具,不断探索并引入以提升团队的技术能力和项目效率。优化流式计算任务的 资源利用率(如 Flink 任务调优、Kafka 分区策略调整)。 5. 国际化安全反作弊技术团队其他开发工作。
1. 深入理解滴滴海外业务模式、流程和系统架构,和相关产品技术、业务运营高效沟通,设计合理的数据仓库架构。 2. 充分利用滴滴现有的各种数据仓库及反作弊处理平台,设计、开发和维护高效、可扩展的大数据处理系统,以支持安全反作弊业务的数据驱动决策和业务发展。设计并优化离线/实时数仓模型(如 ODS、DWD、DWS、ADS 分层),支持实时报表、监控和风控等场景。 3. 对多源异构数据(日志、事件消息、API、爬虫数据等)进行清洗、解析和结构化处理,提取关键业务信息。解决数据清洗中的 脏数据、格式混乱、缺失值、重复数据 等问题,提升数据质量。与数据开发、算法、业务团队协作,理解需求并构建高效的数据处理流程。 4. 跟踪大数据领域的新技术、新工具,不断探索并引入以提升团队的技术能力和项目效率。优化流式计算任务的 资源利用率(如 Flink 任务调优、Kafka 分区策略调整)。 5. 国际化安全反作弊技术团队其他开发工作。