logo of bytedance

字节跳动AI Infra架构师-IaaS

社招全职A167079地点:西安状态:招聘

任职要求


1、熟悉Linux环境下的C++/Python/Go/Java等一种或多种语言,扎实代码功底和实战能力;
2、具备较强的学习能力,能够快速适应新技术和工具;
3、熟悉AI基础设施生态,有应用技术选型和落地实践成功案例。

具备以下条件之一者优先:
1、了解分布式计算与加速,有大规模集群建设、运维、训练调优…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、与AI算法和业务团队密切合作,支持业务新算法和模型组件的选型和集成,助力模型算法框架的演进和迭代,结合字节跳动和业界优秀实践产出完整技术架构和业务最佳实践的一站式平台解决方案;
2、负责模型训练和推理所需的IaaS基础设施的规划、迭代与框架维护,致力于提供一致性、可扩展、高可靠的平台技术底座;
3、对外部ToB客户提供AI基础设施服务,提高大规模部署下模型基础设施的效率度量、扩展性和可管理性;
4、跟踪业界AI新兴技术和行业趋势,参与新技术的研究与应用,沉淀平台能力,助力客户AI落地。
包括英文材料
Linux+
C+++
Python+
Go+
还有更多 •••
相关职位

logo of aliyun
社招8年以上云智能集团

1. 负责金融行业技术架构解决方案设计,重点满足客户IaaS、PaaS、智算等技术架构方面需求,依托阿里巴巴和蚂蚁金服在分布式架构和智算架构领域的实践,构建云原生、AI原生等全栈解决方案。 2. 负责对金融客户的信息科技规划进行深度分析和洞察,形成有领先型的云化架构转型和智算架构转型方案,对用户信息科技部门和高层领导进行决策影响;其中对标杆客户进行轻咨询类规划引导,形成更加针对性的客户解决方案。 3. 熟悉阿里巴巴相关IaaS、PaaS、大模型、智算等产品能力和竞争优势,掌握各类技术方案的相应技术参数指标,针对不同业务需求优化设计,负责组织相应的POC进行方案支持,保证产品方案的客户价值、可落地性和差异化优势。 4. 面向金融企业客户,在客服、投研、投顾、风控、营销、内部工作提效等场景中,以大模型为基础,通过使用langchain、RAG、SFT、Agent等相关技术架构结合大模型产品设计可落地的大模型应用解决方案,解决客户实际场景问题。 5. 收集客户需求,结合技术研判,向产研部门反馈产品优化需求,提升产品市场竞争力和市场占有率。

更新于 2025-11-03杭州|上海
logo of tencent
社招5年以上CSIG产品

1.技术支撑:为行业客户提供腾讯云通用计算和异构计算产品相关的技术咨询服务,充分理解客户需求及行业特点,提供公有云基础设施的方案设计和产品支持; 2.项目落地:针对特定行业客户输出需求说明、技术方案、落地推进、最终交付,以及过程中的问题处理,满足客户在iaas/paas产品上的需求跟进; 3.需求反馈:通过自身的专业技术能力,洞察行业发展趋势,对客户的需求进行洞察和挖掘,并形成产品的后续能力补充; 4.方案沉淀:对腾讯云本身以及结合云各类产品(容器/网络/存储/机器学习平台等)为客户进行具体解决方案文案的输出和持续更新; 5.产品宣导:对不同行业的其他架构师进行AI Infra解决方案和最佳实践宣导,并在过程中进行方案和文案的优化和更新。

更新于 2025-08-12深圳
logo of bytedance
社招A141967

1、与AI算法和业务团队密切合作,支持业务新算法和模型组件的选型和集成,助力模型算法框架的演进和迭代,结合字节跳动和业界优秀实践产出完整技术架构和业务最佳实践的一站式平台解决方案; 2、负责模型训练和推理所需的IaaS基础设施的规划、迭代与框架维护,致力于提供一致性、可扩展、高可靠的平台技术底座; 3、对外部ToB客户提供AI基础设施服务,提高大规模部署下模型基础设施的效率度量、扩展性和可管理性; 4、跟踪业界AI新兴技术和行业趋势,参与新技术的研究与应用,沉淀平台能力,助力客户AI落地。

更新于 2025-04-01上海
logo of bytedance
社招A174558

团队介绍:IaaS字节跳动基础架构IaaS团队致力于不断创新,推动云计算产业发展和IaaS架构演进。作为云计算基座我们服务了字节跳动旗下包括抖音、今日头条、西瓜视频、飞书等明星产品, 并通过火山引擎云基础产品服务外部客户:包括金融、汽车、游戏、电商、社交媒体、高端制造、科研院所等各行各业的丰富场景, 为亿级用户量的APP和ToB业务提供安全、稳定、高性价比的算力。 我们坚持全栈自研,软硬一体,全面拥抱云原生, 在技术上追求极致: -基于智能库存调度、精细化监控以及自动化运维能力, 来管理遍布全球超百万台规模的服务器集群; -自研高吞吐、低延迟、高弹性的网关网元以及高弹性高并发的计算存储服务来应对抖音春晚、双十一等各种流量洪峰; -打造万卡超大规模的GPU集群, 与机器学习平台、火山方舟一起构建了从基础设施到模型生态的完整解决方案; -此外,还提供和火山引擎公有云同源架构的veStack混合云平台,支撑客户的本地化部署和跨云资源的弹性伸缩等。 1、负责大模型训练和推理所需的IaaS基础设施的规划、建设与维护; 2、与业务团队密切合作,支持业务新算法和模型的集成,并优化其在IaaS基础设施上的性能; 3、开发和维护自动化工具,提高大规模模型基础设施的可观测性、可扩展性和可管理性; 4、跟踪业界AI新兴技术和行业趋势,参与新技术的研究与应用,推动基础设施的持续升级。

更新于 2024-07-05北京