阿里云阿里云智能-大模型架构师(能源与电力)-北京(政企事业部)
任职要求
1、本科及以上学历,人工智能、计算机、大数据、电子等相关专业背景。 2、5年以上云计算、AI基础设施或高性能计算(HPC)相关领域的解决方案规划、设计、交付等工作经验。 3、拥有LLM、开源框架(例如 Jax、PyTorch)、大数据和机器学习框架以及数值编程框架(例如 Python 或 MATLAB)的经验,有一定的代码能力 4、良好的方案产出和沟通宣讲能力,能够很好完成面相客户中高层的方案汇报,及重大市场活动中的方案/技术分享 5、有AI基础设施的核心组件,包括算力平台、容…
工作职责
1、深入理解客户业务需求,帮助客户选择适合其业务场景的技术路径和产品组合,利用AI技术知识、架构方法、咨询技能来影响客户技术决策 2、熟悉大模型算法工程化,与客户合作进行模型训练、推理和模型应用等POC,含展示功能、调整模型、优化模型性能、测试分析、Agent搭建、模型调用等内容 3、依据客户需求和技术研判,推动产研部门持续优化产品,助力提升产品竞争力,同时沉淀最佳实践,以及脚本、模板、参考架构等可复用的技术资产 4、持续跟踪行业动态和技术趋势,并与产品团队协作,打造创新的人工智能(大模型、智算、一体机等)解决方案 5、支持市场活动,作为领域专家参与市场洞察、行业标准、市场排名报告、白皮书撰写等活动,并在行业峰会、技术沙龙等市场活动中进行技术传播和分享
-负责能源电力、油气等行业头部客户的销售工作,包括目标客户的开发、维护与跟进,达成既定的OKR指标 -负责制定行业客户整体销售及市场策略规划 ,定期拜访客户,挖掘和提炼客户需求,积极跟进,制定合理方案,推进合同谈判并有效关单。为客户提供顾问式销售服务 -维护跟进大客户的商务工作,在现有基础上积极拓展客户业务需求,对外能够与客户信息、业务等条线进行沟通协调,提供满足客户需求和痛点的解决方案,有效消除客户顾虑,并能综合运用各种有效的方法制定策略、拉通内部资源(销售、解决方案架构师、产研、交付等)达成业务目标,最终推动项目落单 -对重点大客户全流程负责,能打通客户全流程关系链条,定期拜访客户高层和各业务条线,能够独立进行商务进度的把控和项目跟进
- 协同电力销售团队,基于人工智能、大模型、云计算、算力芯片等产品和技术,进行客户需求识别商业机会,提供行业级与客户级解决方案支持,支持项目招投标工作 -负责电力解决方案的设计,将大模型、人工智能、云计算、智能算力等技术应用于能源企业数智化转型之中 -收集客户反馈与竞品信息,协同产研团队进行需求设计、调研和打磨 -支持行业大会宣讲、市场活动布道、客户培训宣讲等工作 -支持电力能源行业生态的建设工作,引入和融合合作伙伴能力,为客户提供一站式落地方案
1. 产品战略与规划: • 制定能源AI产品中长期发展战略,聚焦AI大模型、智能体、时序预测等前沿技术在能源行业的落地路径; • 主导能源AI时序大模型的产品架构设计,涵盖发电功率预测、负荷预测、电价预测、故障预警等核心场景; • 设计并推动“能源融运管退智能体”产品闭环,整合金融、运营、资产管理和退出策略,实现全生命周期智能决策支持; 2. 产品管理与落地: • 主导产品需求分析、功能定义、MVP设计及迭代优化,协调算法、工程、数据、业务团队高效推进项目交付; • 建立数据驱动的产品评估体系,量化AI模型在提升发电效率、降低运维成本、优化资产回报等方面的实际价值; • 深入理解风光储、电网、综合能源服务等业务场景,推动AI产品与客户业务系统的深度集成; 3. 跨职能协作与生态建设: • 与AI算法团队紧密合作,定义模型训练目标、评估指标与工程化接口标准; • 联动市场与销售团队,输出产品白皮书、解决方案案例,支撑重点客户POC与商业化落地; • 建立与能源集团、设计院、设备厂商、碳交易平台等生态伙伴的合作机制,拓展AI产品应用场景; 4. 团队建设与领导力: • 领导能源AI产品团队,培养团队在能源+AI交叉领域的专业能力,推动技术创新与产品突破。
基座大模型研发与创新 参与设计并研发面向大规模多元时间序列的预训练基座模型,探索适用于时序数据的 Transformer变体(如Informer,FEDformer, PatchTST)及创新架构。 负责构建超大规模,高质量的时序预训练数据集,设计掩码重建,上下文预测等自监督预训练任务。 研究时间序列中的关键问题,如长周期依赖建模,多尺度特征提取,缺失值处理,以及时序与文本/事件等多模态信息的对齐与融合。 模型深度优化与领域适配 针对特定高价值场景(如电力负荷预测,量化金融,工业设备预测性维护),对基座模型进行深度微调与优化,实现"通用能力"到"领域专家"的转化。 研发高效的模型适配技术(如参数高效微调 PEFT),确保基座模型能够快速,低成本地适配到多样化的下游任务。 系统工程与高性能推理 负责将模型从研究原型推进到稳定,高性能的生产级系统。优化训练框架,利用混合并行(数据并行,模型并行,流水线并行)技术实现千亿参数模型的分布式训练。 主导模型的高效推理优化,应用量化(INT8/ FP4),编译优化等技术,大幅降低服务延迟与资源消耗,支撑海量时序数据的实时预测需求。 技术前瞻与行业赋能 追踪时间序列分析,大模型预训练的前沿学术进展,并将有潜力的技术引入到产品研发中。 与业务团队紧密合作,深入理解行业痛点,将基座模型的强大能力转化为可衡量的业务价值,定义时间序列预测领域的新标准。 岗位要求 必备条件 计算机科学,人工智能,统计学或相关专业硕士及以上学历(博士优先).