logo of aliyun

阿里云阿里云智能-AI Data 工程师-MaaS数据-杭州

社招全职1年以上云智能集团地点:杭州状态:招聘

任职要求


1. 熟练掌握javapythonsql中一种或多种数据处理语言等,具备良好的编程习惯与工程能力;熟悉 Linux/Unix 环境及常用 Shell 操作;
2.  熟悉主流大数据平台(如 Hadoop、Spark、Flink、Ma…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 全模态数据流水线与架构建设:参与万亿级、EB级海量多模态数据(涵盖多语言文本、图像、音频、视频及 Agent 行为数据等)的采集、存储、清洗与加工。设计并实现高效率、高质量的全模态流程编排引擎及核心处理算子(Pipeline),保障海量异构数据的规模化流转与高扩展性。
2. 全模态数据自动化标注:能够结合深度学习与多模态大模型技术,研发并落地智能化的数据处理策略。利用算法模型进行跨模态特征提取与对齐、低质量噪声数据过滤、复杂场景下的异常数据拦截与高价值数据挖掘,大幅提升数据处理的自动化水平与数据质量。
3. 多模态数据对齐、评估与合成:主导大规模“图-文”、“视-文”、“音-文”等多模态对齐数据的规模化生产,尤其是在稀缺数据领域,探索并落地智能标注与前沿的数据合成(Data Synthesis)技术。与算法团队紧密合作,深度参与多模态大模型SFT及对齐阶段的高质量数据集构建、配比调优与评测,并通过评测结果反向持续优化语料质量。
4. 数据资产化与科学分析:主导AI应用的全流程数据仓库与数据分析研发工作,包括数据同步、数据建模、数据计算、数据挖掘分析与数据可视化;构建高扩展性、高一致性、高业务价值的AI应用核心数据资产体系,确保指标准确、及时与可追溯
5. 关注数据处理领域的新技术、新工具和新方法,积极参与技术分享和团队内部培训,推动团队的技术升级和创新。
包括英文材料
Java+
Python+
SQL+
编程规范+
Linux+
Unix+
Bash+
大数据+
还有更多 •••
相关职位

logo of bytedance
社招3年以上A147138

1、持续推进豆包语音大模型最新技术的工程优化和应用落地; 2、负责设计并实现高可用、可扩展、分布式机器学习平台,支撑多地域语音相关业务模型服务高效迭代更新; 3、与算法、引擎、后端工程师密切配合,理解语音大模型MaaS能力建设和部署运维流程,负责/参与机器学习平台的设计、开发和维护; 4、持续提升平台效率、易用性、降低使用成本,探索业界前沿的机器学习相关技术,设计并实现到机器学习平台。

更新于 2025-03-28杭州
logo of aliyun
社招3年以上云智能集团

1、政企客户高价值 AI 场景挖掘: AI产品在教育科研、民生服务、文化文旅、智能硬件、客服等重点场景的 AI 机会,识别能带来高速增长的 AI 场景,将客户痛点转化为基于大模型的 Token 消耗方案。 2、MaaS 架构设计: 负责 AI Native 客户的端到端方案设计,包括但不限于 RAG(检索增强生成)、智能体(Agent)工作流、行业模型微调以及多模态能力的落地。 3、技术落地与陪跑: 具备复杂AI agent项目的落地实践经验,理解客户的业务场景和需求,帮助客户快速构建 AI 应用。 确保 AI 场景在实际生产中的落地,并持续优化以提升 Token 的质量与消耗规模。 4、行业能力沉淀: 将零散的项目经验提炼为标准化的行业解决方案,参与内部产品与研发部门沟通协调,促进解决方案落地及产品迭代,包括商务模式、项目进度、产品及服务交付等;可复用的行业解决方案与最佳实践并负责和各区域协同落地,为阿里云AI战略的长期发展储备关键客户与技术资产。 5、商业闭环驱动: 对 Token 消耗量及业务活跃度负责,负责客户接入及接入后的持续成功。从技术视角协助团队创新商业策略,实现规模与技术口碑的双赢。 6、AI 市场心智建设:联动AI解决方案、产品、市场等团队,打造面向细分市场与重点客户的价值主张;策划并执行线上线下技术研讨会、Demo演示等活动,激发客户兴趣,传递技术价值,赢得客户信任。 7、售前项目支持:配合 BTE 等高质量完成售前相关工作;

更新于 2026-04-07成都|北京|武汉
logo of bytedance
校招A77447A

团队介绍:Data AML是字节跳动的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、参与AML方舟推理千亿级TPM流量调度核心架构的开发、优化与迭代,共同打造国内领先的AI MaaS平台; 2、在公有云&云原生(Kubernetes)环境下,深入设计和实现大模型推理服务的关键子系统; 3、探索并实现智能流量路由、精细化服务治理策略,保障平台在超大规模负载下的超高可用性(99.99%+)与极致性能; 4、持续优化平台在资源调度效率、服务稳定性、成本效益等方面的表现; 5、与团队一起攻克大规模分布式系统带来的复杂挑战,确保平台能够弹性扩展,支撑业务的飞速增长。

更新于 2025-07-29上海
logo of bytedance
社招3年以上A30891

1、持续推进豆包语音大模型最新技术的工程优化和应用落地; 2、负责设计并实现高可用、可扩展、分布式机器学习平台,支撑多地域语音相关业务模型服务高效迭代更新; 3、与算法、引擎、后端工程师密切配合,理解语音大模型MaaS能力建设和部署运维流程,负责/参与机器学习平台的设计、开发和维护; 4、持续提升平台效率、易用性、降低使用成本,探索业界前沿的机器学习相关技术,设计并实现到机器学习平台。

更新于 2025-03-28北京