阿里巴巴1688-Java技术专家-AI Data
任职要求
1、计算机或相关专业本科及以上学历,5年以上 Java 后端开发经验; 2、熟练掌握 Java、Spring Boot、并发编程及分布式系统设计,熟悉消息队列、缓存、数据库及大数据组件(如 Spark、Flink); 3、了解 AI Age…
工作职责
1、负责1688 数据中心 AI Data重点项目,以及AB实验平台、数据资产平台、指标中心、ChatBI等数据平台的后端系统设计与核心模块开发及优化; 2、参与AI Agent相关系统研发,包括但不限于智能任务调度、工具调用(Tool Calling)、记忆管理、多轮对话状态维护等后端能力设计与实现; 3、设计高并发、高可用、可扩展的服务架构,支撑 AI Agent 与数据平台的深度集成,如通过函数调用触发数据查询、指标计算或实验配置; 4、与数据科学家、算法工程师及前端团队高效协作,推动数据产品落地,提升业务决策效率与智能化水平。
1、深度参与大模型智能体系统的架构设计与持续优化,确保系统的高效性、可扩展性和稳定性; 2、利用最新的智能化新范式和先进的AI技术,深入分析并解决广告、医疗、民生等前线业务领域的复杂风控问题; 3、负责为前线业务部门提供端到端的智能化解决方案,并推动方案的实施和落地,实现业务价值; 4、主导搭建全新的智能反作弊风控系统,通过前沿技术手段有效识别和防范各类作弊行为,保障公司业务营销资金的安全。
1、团队愿景:在大模型进入深水区的今天,真正拉开差距的,不再只是模型结构,而是数据的质量、成本与评测方法。 我们对标 Scale AI,正在建设主权模型时代的 AI 数据基础设施:以最低的总体成本,持续为模型训练与迭代提供最高质量的数据、数据配方与评测体系。 在这里,你将参与决定用什么样的数据能真正塑造模型能力,把分散、复杂、真实的业务数据,转化为可 规模、可验证、可复用的模型竞争力,参与定义 AI 时代最底层、也最关键的基础设施。 2、 主导多模态模型训练数据的生产项目:作为算法与标注资源的“连接器”,将抽象的模型需求转化为可执行的标注规则和验收标准。管理内外部标注团队(包括外包/众包资源),把控项目进度与成本,确保大规模数据交付的准时率与合格率。 3、流程设计与工程优化:设计 SFT、 RLHF 等数据流转机制,搭建高效的 Workflow。协同多方团队,优化标注效率和质量。 4、负责构建从数据寻源、抓取、到复杂异构数据解析的全流程系统,解决多模态数据的清洗与结构化难题。 5、利用模型生成数据等方式,构建自动化数据扩充流水线,降低对人工标注的依赖,突破数据规模瓶颈。 6、建立数据质量评估体系,系统性分析标注数据的质量分布特征,提升标注效率。
1. 参与MaxCompute大数据+AI一体化框架和运行平台的设计、开发与技术演进,支撑阿里集团内部和公有云上的Data+AI一体化计算场景; 2. 能够独立完成项目需要的系统分析、设计,编码,测试和上线部署任务,确保项目的进度、质量和稳定性要求; 3. 技术基础扎实,沟通和团队合作流畅,乐于分享,能够积极参与团队中的设计评审和代码评审工作,并能给出相关改进建议; 4. 有一定的技术前瞻性,可以对平台演进中的技术需求(如AI训练中异构环境的数据处理加速)进行预研和设计,满足对大数据+AI平台快速发展过程中,对各项业务场景的客户需求; 5.该职位涉及值班响应的职责,在服务级别协议(SLA)时间内做出对客响应,推动客户问题的解决,改善客户体验。