logo of antgroup

蚂蚁金服蚂蚁集团-时序算法专家-杭州/北京

社招全职3年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1、教育背景优秀,计算机相关专业研究生;
2、有较好的计算机科学和算法基础,编程能力强;
3、有代码/自然语言/多模态大模型、深度序列/生成模型、时序分析等相关技术或者落地经验者优先;
4、产出需在论文、开源、比赛成绩、项目上满足1条或者多条;
 4a、算法研究背景在诸如ICML/ICLR/NIPS、ACL/EMNLP/KDD、CVPR/ICCV/ECCV等会议有相关论文发表者优先;
 4b、应用系统研究背景在诸如WWW、SIGMOD/VLDB…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、算法研发:负责时序异常检测、时序预测等核心算法的研发与迭代,解决复杂业务场景下的挑战。
2、平台建设:设计并打造系统化的AIOps平台,为蚂蚁智能平台工程提供核心能力支撑。
3、模型创新:参与时序基础大模型 (Foundation Model) 的研发,探索前沿技术边界。
包括英文材料
算法+
大模型+
ICML+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术类-算法

1、核心算法研发:主导Agentic RL及多智能体(Multi-Agent)算法的研发,融合大模型和多模态(LLM/VLM)的推理能力。 2、训练框架优化:负责RL训练框架的性能调优与迭代,提升大规模训练效率。 3、智能体构建与落地:构建面向真实场景的智能体,包括但不限于GUI Agent、代码Agent、根因分析(RCA)Agent等,驱动业务创新。

更新于 2025-07-28北京|杭州
logo of aliyun
社招5年以上云智能集团

1、技术方案设计 • 基于业务关键路径与风控等级,主导可靠性目标体系设计:SLA、SLO、SLI 定义与度量口径固化,建立 Error Budget 机制并推动准入/发布决策闭环; • 设计统一的可观测性与事件数据模型(日志/指标/链路/事件/变更),输出监控覆盖与告警分级策略; • 面向容量与资源弹性制定预测与规划方案:峰值建模、容量水位、扩缩容阈值、突增防护。 2、技术实现 • 将可靠性方案拆解为落地任务:指标接入、探针开发、告警规则、治理脚本、自动化运维工具、调度策略优化等,按规范交付; • 编写高质量自动化脚本与服务(Python/Go/Java/Shell),实现批量操作、巡检、数据对账、状态校验、健康探测与回滚; • 深度参与故障应急:值班 OnCall、事件指挥、跨团队协调、战情同步;推动 MTTA/MTTR 降低。 3、安全、稳定、效率和性能优化 • 建立全链路 SLI 指标体系:可用性、延迟、吞吐、错误率、资源利用率、队列深度、调度成功率、实例生命周期关键状态等;持续可视化与例会化分析; • 优化告警体系:告警质量指标(噪音率、误报率、漏报率、可行动性)、Alert → Incident 转换标准、分级通知矩阵; • 推进开发协同(左移):在设计、开发与测试阶段加入稳定性 CheckList(幂等性、重试策略、熔断/超时、探活、依赖降级、状态收敛)。 4、技术预研 • 预研 Chaos 工具/平台并结合业务特性沉淀标准化故障模型与韧性指标; • 评估智能告警关联、根因定位、异常检测(时序/拓扑/依赖图谱)算法的适用性与成本收益,推动 PoC 与灰度落地; • 针对下一代可观测性(日志与指标融合、采样优化、eBPF 无侵入追踪)提出演进路线。 5、技术规划 • 基于业务增长曲线、产品演进与战略项目制定年度/季度稳定性 OKR:SLO 提升、MTTR/噪音告警压降、自动化覆盖率、演练覆盖率、容量冗余下降、成本优化目标等; • 规划多活/容灾演进路线:跨 Region 容灾 → 主动故障转移 → 智能调度;分阶段 KPI(RTO/RPO、演练周期、切换自动化程度); • 制定发布与变更分级治理路线:高风险变更识别 → 准入标准 → 影子/灰度策略 → 自动化验收 → 全量放量策略 → 回滚演练常态化。

更新于 2025-11-26北京|杭州
logo of aliyun
社招5年以上云智能集团

负责数据中心数字孪生模型的应用规划与价值挖掘。将数字孪生技术能力,转化为可衡量的数据中心运维业务价值。 1. 应用蓝图规划与场景定义:深入分析数据中心运维的业务痛点,与运维团队紧密合作,主导规划数字孪生在故障预测、故障定位、能效调优三大方向的应用演进路线图。 2. 结合数字孪生模型和监控系统的的时序数据,发掘物理属性与监控数据的关联关系,构建兑现业务场景落地的可行技术路线。 3. 在故障预测、故障定位、能效调优三大方向上开发团队协作,推动上述应用功能的落地、测试和上线。建立并跟踪应用价值的量化评估指标,用数据证明业务价值,并驱动产品持续迭代。

更新于 2025-10-30北京|杭州
logo of antgroup
社招解决方案-行业解

1. 客户需求分析与方案设计: • 深入理解客户新能源业务场景,挖掘AI或智能体可落地的需求,提供定制化解决方案; • 设计端到端AI技术架构,涵盖数据、算法、工程部署等关键环节; • 撰写技术方案文档(如POC方案、可行性分析、实施路线图); 2. 市场洞察及需求提炼: • 与新能源业务团队紧密合作,理解政策法规(如《电力市场交易规则》《全国碳排放权交易管理办法》《136号文》)及市场动态,转化为产品需求; • 支持构建新能源+AI的数字化解决方案(如虚拟电厂、储能优化、电碳证管理系统、能源智能体等); 3. 客户沟通与技术推广: • 向客户讲解AI技术能力、综合能源平台能力、应用场景及商业价值; • 主导技术交流、方案演示及POC(概念验证)测试; • 解答客户技术疑虑,提供专业咨询建议; 4. 行业洞察与最佳实践沉淀: • 跟踪AI前沿技术趋势,结合新能源行业特点(如电力改革等)提炼解决方案; • 总结项目经验,形成可复用的方法论和标准化方案。

更新于 2025-06-30北京|上海|杭州