字节跳动机器学习平台产品解决方案架构师-火山引擎
任职要求
1、本科及以上学历,3年以上机器学习平台产品或商业化相关经验,成功落地过机器学习平台项目,对于生成式人工智能的发展有独立见解; 2、熟悉机器学习算力集群架构、工程架构以及平台端到端的业务流程; 3、有ToB机器学习平台产品从0-1孵化、公有云/私有云智算中心项目经验; 4、有大模型预训练、精调、推…
工作职责
1、跟踪人工智能、机器学习方向的全球前沿趋势,例如多模态数据工程、大规模分布式训练、分布式推理,对产品业务方向有独到思路; 2、对LLM、DIT、VIT技术架构的原理、工程框架有深入理解,对主流开源模型进行编码,熟悉开源模型微调/推理优化产品方案; 3、对接客户的算法、工程团队,提供产品接入技术支持,协同商务完成对接需求,对产品的业务目标负责; 4、深刻洞察客户需求,沉淀形成面向目标客户、目标场景的产品解决方案,助力客户AI开发压缩项目周期、降本增效、业务创新,推动产品方案从0到N,可复制、可规模化售卖; 5、与内外团队配合,推动产品持续迭代优化,确保产品方案与市场需求匹配,完成项目方案规划和交付。
1、负责火山引擎-方舟大模型平台的研发,研究大模型在千行百业应用落地的系统化解决方案,大幅降低大模型应用的IT成本,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式; 2、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、模型训练、模型推理、数据管理、工作流编排等。
1、负责火山引擎-方舟大模型平台的研发,研究大模型在千行百业应用落地的系统化解决方案,大幅降低大模型应用的IT成本,满足用户不断增长的智能交互需求,全面提升用户在未来世界的生活和交流方式; 2、覆盖机器学习系统多个子方向领域的工作,包括:资源调度、模型训练、模型推理、数据管理、工作流编排等。
1、AI战略规划:为企业客户提供AI技术转型的顶层设计,包括技术选型、场景落地规划、实施路线图及ROI分析,推动客户实现智能化升级; 2、技术解决方案设计:基于大模型(LLM)、智能体(Agent)等前沿技术,结合行业需求设计可落地的AI解决方案; 3、客户需求分析与调研:通过访谈、数据分析等方式挖掘客户痛点,输出需求分析报告,明确AI应用场景和优先级; 4、行业趋势与技术研究:跟踪全球AI技术发展动态(如多模态模型、Agent框架、AI Agent平台等),输出行业白皮书、案例分析及技术研究报告; 5、培训与支持:为客户管理层及技术团队提供AI技术培训,协助制定内部AI能力建设计划; 6、项目管理:协调内外部资源,推动AI项目从规划到落地的全生命周期管理,确保交付质量和客户满意度。
团队介绍:IaaS字节跳动基础架构IaaS团队致力于不断创新,推动云计算产业发展和IaaS架构演进。作为云计算基座我们服务了字节跳动旗下包括抖音、今日头条、西瓜视频、飞书等明星产品, 并通过火山引擎云基础产品服务外部客户:包括金融、汽车、游戏、电商、社交媒体、高端制造、科研院所等各行各业的丰富场景, 为亿级用户量的APP和ToB业务提供安全、稳定、高性价比的算力。 我们坚持全栈自研,软硬一体,全面拥抱云原生, 在技术上追求极致: -基于智能库存调度、精细化监控以及自动化运维能力, 来管理遍布全球超百万台规模的服务器集群; -自研高吞吐、低延迟、高弹性的网关网元以及高弹性高并发的计算存储服务来应对抖音春晚、双十一等各种流量洪峰; -打造万卡超大规模的GPU集群, 与机器学习平台、火山方舟一起构建了从基础设施到模型生态的完整解决方案; -此外,还提供和火山引擎公有云同源架构的veStack混合云平台,支撑客户的本地化部署和跨云资源的弹性伸缩等。 1、负责大模型训练和推理所需的IaaS基础设施的规划、建设与维护; 2、与业务团队密切合作,支持业务新算法和模型的集成,并优化其在IaaS基础设施上的性能; 3、开发和维护自动化工具,提高大规模模型基础设施的可观测性、可扩展性和可管理性; 4、跟踪业界AI新兴技术和行业趋势,参与新技术的研究与应用,推动基础设施的持续升级。