logo of antgroup

蚂蚁金服网商银行-算法评测工程师-杭州-1024热招

社招全职3年以上技术类-算法地点:杭州状态:招聘

任职要求


1. 计算机、信息、人工智能、数据等相关专业本科及以上学历;三年以上互联网及传统行业开发测试和质量保障经验,具备一年以上AI/算法类产品的算法评测等测试经验(如大模型/推荐/搜索/NLP系统);
2. 熟悉算法服务测试场景(如精度验证、AB实验评估等),精通至少一个测试领域(自动化/性能/安全);
3. 熟悉主流算法框…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责网商银行基于大模型等AI技术构造的智能化产品评测工作,确保业务场景中的模型效果、功能正确性、性能指标符合预期;
2. 负责构建智能产品对应模型的评测数据集,并持续运维评测集保障其高质量、有效性并可持续使用;
3. 根据评测集设定的目标业务指标和模型指标,进行评测结果badcase初步归因,支撑模型持续迭代;
4、开发适配算法服务的测试工具,例如评测集批量构建、自动化评测等。
包括英文材料
学历+
算法+
大模型+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术类-算法

我们致力于打造银行信贷领域的新一代“智能决策大脑”。我们以行业与产业研究为锚点,以数据智能为引擎,深度融合资深信贷专家的经验与海量异构数据洞察,构建面向信贷全生命周期的领域专属决策大模型。 1.主导信贷大模型的后训练体系:通过有监督微调(SFT)、奖励模型(RM)训练、人类反馈强化学习(RLHF)、直接偏好优化(DPO)等领域领先技术,让模型不仅“会回答”,更能“可解释、答得准、判得稳、符合专家直觉”,实现与信贷业务目标的深度对齐。 2.构建垂直领域智能Agent系统的能力:能主导信贷场景下Intelligent Agent的核心框架设计,融合感知、规划、执行与持续学习机制,并通过知识图谱、RAG、NL2SQL等技术打通非结构化知识、结构化数据与自然语言交互,实现从行业洞察、风险画像到决策支持的端到端自动化。 3.打造高质量领域数据飞轮:从零构建面向信贷场景的指令与偏好数据集,设计数据配比、清洗、增强与合成策略,持续提升数据效率与泛化能力——因为你知道,好模型的背后,是更聪明的数据。 4.建立科学严谨的评估体系:构建覆盖准确性、逻辑一致性、风险敏感度、幻觉控制等多维度的自动化评测 pipeline,用数据驱动模型迭代,确保每一个版本都比上一个更可靠、更可用。 5.站在AI+金融的最前沿:紧密跟踪全球大模型的最新进展(如新型偏好学习、多Agent协作等),快速将学术突破转化为业务生产力,解决真实世界中复杂、高 stakes 的信贷决策挑战。同时将领域化的研究转化为高质量的顶会论文,形成持续学术影响力。

更新于 2025-11-13上海|杭州
logo of bytedance
社招A45571A

团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok直播研发团队,旨在实现TikTok直播业务的研发工作,搭建及维护业界领先的产品。 加入我们,你能接触到包括:社交互动、营收活动、主播生态、消费订阅、游戏直播、公会&运营平台等核心业务场景,支持产品在全球赛道上高速发展; 也能接触到包括服务架构、大模型算法、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。 在这里,团队专业且纯粹,合作氛围平等且轻松。 目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 1、负责TikTok直播策略方向的算法评测及评测体系建设,包括从算法到工程的算法评测能力建设、评测标准化、评测自动化、算法质量兜底能力建设、快速问题诊断能力、智能化评测能力等内容; 2、算法评测工程化能力建设:包括工具平台开发、与业务深度协作解决业务痛点、算法质量运营等内容; 3、策略产品测试:与产品研发团队密切配合,完成算法场景评测等工作,保障模型交付质量; 4、质量体系建设:模型算法测试相关工具建设,自动化测试、持续集成、监控报警建设; 5、线上稳定性保障:重要线上问题的分析,定位,同时推进相关问题系统性优化解决。

更新于 2024-08-14北京
logo of dingtalk
校招钉钉2026届秋

1. 构建会议AI算法工程体系(评测系统、监控系统、标注系统、AI Agent架构) 2. 会议AI基础模型的接入和优化(模型调研、训练和推理,算法工程建设) 3. AI产品的功能完善,智能化提升(AI听记、会议AI助理等线上产品的开发) 4. AI解决方案的设计和应用落地(找到具有客户价值的落地场景,真正为客户解决问题)

更新于 2025-11-24杭州
logo of alibaba
实习阿里国际2026

AI Business成立于2023年4月,是阿里国际数字商业集团设立的一层业务组织,专注于AI技术能力建设和AI产品能力输出,旨在用最先进的AI技术重塑平台竞争力,为商家和用户带来极致的电商体验。 作为跨境电商领域的AI先锋,我们坚定地相信人工智能对塑造未来电商的关键作用,并坚持对AI领域人才的培养和发展。我们已经汇聚了业内顶尖的AI算法专家、AI工程师和AI产品团队,并诚挚邀请有共同使命感、追求创新与卓越的AI人才加入我们的团队,共同用AI技术书写数字商业领域的新篇章。 1、应用各类机器学习方法为大模型训练提供高质量训练数据,包含文本、图片、视频、音频等数据类型,探索基于AIGC的数据合成技术,不断提升数据对大模型上表现的贡献,追逐Data-centric AI的数据技术能力 2、建设跨境电商领域的Knowledge Base,从而构建服务阿里跨境电商的RAG、AI Agent 3、在通用BenchMark、业务领域BenchMark基础上,建设大模型自动化评测能力,通过模型评测进行科学数据供给和大模型训练

更新于 2025-04-15杭州