阿里云阿里云智能-AI基础设施解决方案架构师-上海/杭州/北京
任职要求
1、重点本科及以上学历,人工智能、计算机、大数据、电子等相关专业背景。 2、5年以上云计算、AI基础设施或高性能计算(HPC)相关领域的解决方案规划、设计、交付等工作经验。 3、拥有LLM、开源框架(例如 Jax、PyTorch)、大数据和机器学习框架以及数值编程框架(例如 Python 或 MATLAB)的经验,有一定的代码能力 4、良好的方案产出和沟通宣讲能力,能够很好完成面相客户中高层的方案汇报,及重大市场活动中的方案/技术分享 5、有AI基础设施的核心组件,包括算力平台、…
工作职责
1、深入理解客户业务需求,帮助客户选择适合其业务场景的技术路径和产品组合,利用AI技术知识、架构方法、咨询技能来影响客户技术决策 2、与客户合作进行模型训练、推理和模型应用等POC,含展示功能、调整模型、优化模型性能、测试分析、Agent搭建、模型调用等内容 3、依据客户需求和技术研判,推动产研部门持续优化产品,助力提升产品竞争力,同时沉淀最佳实践,以及脚本、模板、参考架构等可复用的技术资产 4、持续跟踪行业动态和技术趋势,并与产品团队协作,打造创新的人工智能(大模型、智算、一体机等)解决方案 5、支持市场活动,作为领域专家参与市场洞察、行业标准、市场排名报告、白皮书撰写等活动,并在行业峰会、技术沙龙等市场活动中进行技术传播和分享
1、负责模型训练平台核心功能开发和架构设计,包括传统CN/NLP/SD/LLM等多场景支持 2、负责大模型后训练工具平台化建设,包括后预训练、微调、对齐等技术落地 3、设计和实现高性能分布式训练系统,打造端到端训练解决方案 4、优化训练调度和资源管理,提升集群利用率和训练效率 5、开发模型训练监控诊断工具,建设可观测性体系
1、深入理解客户业务需求,帮助客户选择适合其业务场景的技术路径和产品组合,利用AI技术知识、架构方法、咨询技能来影响客户技术决策 2、与客户合作进行模型训练、推理和模型应用等POC,含展示功能、调整模型、优化模型性能、测试分析、Agent搭建、模型调用等内容 3、依据客户需求和技术研判,推动产研部门持续优化产品,助力提升产品竞争力,同时沉淀最佳实践,以及脚本、模板、参考架构等可复用的技术资产 4、持续跟踪行业动态和技术趋势,并与产品团队协作,打造创新的人工智能(大模型、智算、一体机等)解决方案 5、支持市场活动,作为领域专家参与市场洞察、行业标准、市场排名报告、白皮书撰写等活动,并在行业峰会、技术沙龙等市场活动中进行技术传播和分享
负责AI平台基础设施的可靠性设计、监控告警、容量规划和性能优化 设计并实施平台的高可用性方案,制定灾备预案和故障响应机制 建立和完善AI平台的可观测性体系,包括日志、metrics、链路追踪等 负责自动化运维工具开发,提升平台运维效率和服务质量 分析和解决系统性能瓶颈,优化资源利用率 参与重大故障定位分析,制定改进方案并跟进落地 持续优化SLO指标,确保平台的稳定性和可靠性
团队介绍:TikTok是一个覆盖150个国家和地区的国际短视频平台,我们希望通过TikTok发现真实、有趣的瞬间,让生活更美好。TikTok 在全球各地设有办公室,全球总部位于洛杉矶和新加坡,办公地点还包括纽约、伦敦、都柏林、巴黎、柏林、迪拜、雅加达、首尔和东京等多个城市。 TikTok研发团队,旨在实现TikTok业务的研发工作,搭建及维护业界领先的产品。加入我们,你能接触到包括用户增长、社交、直播、电商C端、内容创造、内容消费等核心业务场景,支持产品在全球赛道上高速发展;也能接触到包括服务架构、基础技术等方向上的技术挑战,保障业务持续高质量、高效率、且安全地为用户服务;同时还能为不同业务场景提供全面的技术解决方案,优化各项产品指标及用户体验。 在这里, 有大牛带队与大家一同不断探索前沿, 突破想象空间。 在这里,你的每一行代码都将服务亿万用户。在这里,团队专业且纯粹,合作氛围平等且轻松。目前在北京,上海,杭州、广州、深圳分别开放多个岗位机会。 1、作为隐私安全方向的项目经理,对接公司的法务和核心技术负责人,以满足各国各地区法律法规和社会业界对隐私安全不断提高的要求为目标,对接数据主权,权限治理,隐私基础设施建设等不同方面项目,结合对业务以及技术架构的理解端到端交付项目; 2、基于合规要求,深入各业务场景,参与和协助研发侧各团队进行技术方案的设计和落地执行,协助制定和深度理解公司整体在隐私安全合规方面的技术方案,驱动和判断隐私合规标准的拉齐; 3、负责涉及跨部门跨职能的多团队协作的重点项目/项目集的推进落地和全生命周期管理;对项目结果负责,在预期时间内达成既定目标,又兼顾业务影响;持续发现和分析团队、业务、项目中的共性问题,进行风险管理以及流程优化; 4、作为PMO团队(项目管理办公室)一员,结合业务和团队特点,设计以及落地项目管理流程与工具,通过定量/定性分析度量研发和团队协作效率并持续提升,积累和沉淀项目管理经验及方法论、团队知识库赋能培训团队项目管理相关内容。