logo of aligenie

智能互联数据技术及产品部-AI Data系统工程架构师-杭州

社招全职5年以上技术-基础平台地点:杭州状态:招聘

任职要求


1. 拥有计算机科学、信息技术或相关领域的硕士或博士学位。
2. 具备大规模分布式系统研发经验,熟悉spark/flink等大数据系统,熟悉Kubernetes架构和生态,熟悉Docker/Containerd/Kata/Podman等容器技术。
3. 对 AI 系统工程(如迭代模式、端到端系统设计、工程框架、性能建模等)有比较深刻的理解,至少熟练掌握一种常见的深度学习框架,包括但…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责AIData 各大平台的产品技术架构,包含数据资产管理平台、数据标注平台、数据评测平台,以及数据处理平台架构设计和开发。
2. 负责异构资源(GPU、CPU等硬件)的调度优化,实现潮汐资源、混部资源、多云资源的最优化调度。
3. 负责集群和业务服务的稳定性治理、资源利用率提升,通过系统化方式提高GPU、CPU等硬件资源的使用效率。
4. 参与设计高吞吐、低延迟的数据处理 pipeline。针对大模型数据处理场景(如LLM、多模态),优化数据清洗、预取、缓存及异步加载策略,确保数据大规模产出。
5. 领导数据处理集群优化相关团队,关注数据处理系统前沿技术,保持团队技术先进性。
包括英文材料
学历+
分布式系统+
Spark+
Kubernetes+
Docker+
containerd+
Podman+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术类-开发

在Web3席卷全球的浪潮中,我们正用代码重构数字世界的规则——从RWA资产代币化到稳定币架构的颠覆,从全球区块链协作到AI与链式逻辑的碰撞。技术生态的裂变已不可逆,而蚂蚁数科凭借原生区块链架构、密码安全、硬件级防护、跨链隐私计算与Layer2扩展性等硬核技术,已站在风暴眼中央。 此刻,你将与顶尖工程师并肩: - 重构资产流通协议,用智能合约改写价值流转规则; - 设计下一代链上系统,以技术纵深击穿数据孤岛; - 在黄金时代的第一线,用代码定义信任的新范式。 代码即信仰,创新即战场—— 黄金时代正在加速到来——此刻不冲,更待何时? 1. 参与蚂蚁数科Layer2 区块链Jovay 的架构设计、功能开发与性能优化,推动 Jovay 测试网和主网顺利上线; 2. 持续跟踪并深入研究区块链与 Web3 前沿技术动态,具备快速学习与落地应用能力,将最新技术成果高效融入 Jovay 平台,以保持技术领先和产品竞争力。

更新于 2025-06-20北京|上海|杭州
logo of antgroup
社招8年以上技术类-开发

在Web3席卷全球的浪潮中,我们正用代码重构数字世界的规则——从RWA资产代币化到稳定币架构的颠覆,从全球区块链协作到AI与链式逻辑的碰撞。技术生态的裂变已不可逆,而蚂蚁数科凭借原生区块链架构、密码安全、硬件级防护、跨链隐私计算与Layer2扩展性等硬核技术,已站在风暴眼中央。 此刻,你将与顶尖工程师并肩: - 重构资产流通协议,用智能合约改写价值流转规则; - 设计下一代链上系统,以技术纵深击穿数据孤岛; - 在黄金时代的第一线,用代码定义信任的新范式。 代码即信仰,创新即战场—— 黄金时代正在加速到来——此刻不冲,更待何时? 1. 蚂蚁数科Layer2 Jovay架构设计,研发和主网建设; 2. 负责与产品、合规、运营团队协作,开源社区共建,共同打造可持续的Jovay生态; 3. 参与重大技术风险评估与事故应急,建立高可用、高安全的生产级 Layer 2 网络运行体系。

更新于 2025-06-03北京|上海|杭州
logo of bytedance
实习A20567

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:集团信息系统部(Corporate Information System)负责字节跳动信息系统建设。通过构建领先的信息系统,助力公司业务和组织的长期高效经营与发展。与此同时,在安全、隐私、合规层面持续治理,为公司的稳健发展保驾护航。字节跳动的业务模式复杂,用户规模大。到现在,集团信息系统部已经覆盖人事、财务、法务、采购、审批、职场等多个领域,隐私安全工作同步开展,AIGC创新孵化也在逐步落地实现。 1、参与Data Agent架构设计与实现,主要包括Agent架构优化、上下文工程、NL2DSL/NL2Code、效果自动化评估; 2、持续跟进AI与大模型领域技术发展趋势,结合相关实际业务场景引入新技术和新方案,推动团队技术体系的持续迭代升级,支撑业务规模化发展; 3、参与集团内部Data Agent产品技术选型、方案设计、效果优化等,优化AI取数效果,服务集团内部各业务场景。

更新于 2026-01-26深圳
logo of xiaohongshu
社招5-10年引擎

我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。

更新于 2026-03-28上海|北京