阿里云阿里云智能-大模型技术服务专家-政企行业- 北京/深圳/杭州/广州
任职要求
1、数学、计算机专业,本科及以上学历。 2、精通Python,熟练主流深度学习框架,如TensorFlow、PyTorch。 3、熟悉Transformer/BERT/GPT等基础模型结构,熟悉大模型的训练、微调和评测。 4、熟悉常用的Adam、SGD等优化算法,熟悉剪枝、量化等模型压缩技术,熟悉蒸馏、混合精度训练等模型加速技术。 5、有大型的大模型应用落地经验,在语料生成、模型微调、Prompt工程优化、模型评测等领域有具体实践经验。 6、良好的沟通交流以及服务能力,具备需求分析以及项目风险控制能力;具备运维风险意识,能够负责客户界面的整体沟通。 7、熟悉阿里云AI大模型产品如PAI或百炼,持有阿里云大模型ACP认证证书者优先。
工作职责
1、负责政企客户的大模型需求收集、分析,设计服务解决方案,通过SOP的把控,端到端的把控项目风险和履约落地。 2、负责政企客户的大模型项目专家技术支持,包括但不限于模型调优、Prompt工程、工作流、RAG、AI agent。 3、负责阿里云 AIStudio、AIWorks等平台的企业级客户的专家服务,持续推动客户做好标准化大模型迁云、云上优化,并根据现场问题持续反馈推进产品改进。 4、深入大模型和客户业务的结合,沉淀孵化大模型服务解决方案,制定服务差异化竞争策略,助力客户在大模型应用上取得成功。
阿里云专有云是面向政企行业客户的全栈云平台,为企业级客户(政府、金融、部委、央企等行业)提供产品和服务。该岗位主要负责专有云智算平台架构规划、系统设计及核心技术研发。核心职责包括: 1、主导智算平台的全栈架构设计。针对不同平台芯片/不同集群规模做整体方案设计,满足千卡/万卡集群高并发、低延迟、弹性可扩展等需求。 2、性能及稳定性优化,提升集群运行效率,不断提升技术竞争力。 3、跟踪前沿技术趋势,推动新技术落地应用。参与行业标准制定。
1、负责大模型服务解决方案的研发,前沿技术追踪、包括模型训练和调优、推理、RAG、AI Agent等键技术方向攻坚。 2、负责央国企重点客户的大模型落地业务场景识别、需求分析、方案规划以及服务履约落地,持续推动客户做好标准化大模型迁云、云上优化,打造具备行业影响力的大模型服务的标杆案例。 3、负责规划大模型服务的整体演进规划和落地,沉淀可复制的大模型场景服务方案,沉淀具备行业竞争力的大模型智能体服务平台。
1.需求分析与场景识别:与政企客户紧密合作,理解政府和央国企客户的人工智能等新一代信息技术应用诉求,在一个到多个领域有相对深入的行业know-how。能够挖掘客户“与当前人工智能技术发展水平相匹配、具备应用落地条件、投入回报效益明显”的场景。 2.咨询规划与解决方案:理解不同技术(如NLP、CV、多模态等)适用的场景和能力的上下限。能够熟练掌握规划咨询方法,引导客户需求,以云计算+大模型为基础,设计企业总体战略规划及可落地的解决方案(并识别阿里云的商机:算力集群、大模型调用、大模型平台、知识中心、语料基地等)。将传统 IT 技术与大模型结合,解决客户实际场景问题。 3.产品需求反馈与优化:依据市场/客户需求、市场技术动态,结合技术研判向产研部门反馈大模型应用解决方案及Agent工具等的优化建议,推动技术创新和解决方案的迭代升级,提升产品市场竞争力和市场占有率。 4.市场敏感与扩展复制:挖掘可复制、可规模化、符合市场逻辑的通用大模型应用场景,通过客户案例的落地对成功实践进行总结归纳完成从0到1;并对内部团队及客户进行知识和项目分享,促进从1到N的复制。
1、对政企客户的项目交付中对需求痛点/项目需求进行识别,根据大模型的能力设计解决方案,并根据具体场景对算法进行实现和调优,包括数据收集与整理、模型训练、参数调优、评测等; 2、参与政企方向智算项目履约工作,包括智能体设计、搭建以及调优、工作流建设,解决客户/项目中的实际痛点问题,探索基于大模型技术的服务新形态; 3、负责为公司商业化输出的大模型产品提供技术支持,解决客户在使用过程中遇到的问题,确保云服务产品的稳定运行,保障项目的交付、运维、技术运营和平台应急; 4、收集和整理客户的反馈意见,为产品的改进和升级提供依据,不断优化大模型的性能和用户体验; 5、保持技术前瞻性,关注AI学术界和工业界的新动态,应用及探索前沿技术,确保技术方案在实际场景中的有效性。