logo of tongyi

通义大模型数据平台研发工程师

校招全职通义2026届秋季校园招聘地点:北京 | 杭州状态:招聘

任职要求


1. 计算机科学或相关专业硕士及以上学历,具有扎实的计算机、机器学习等理论基础。
2. 计算机基础(操作系统、数据库、算法数据结构、网络、概率统计等)扎实,有优秀的编码能力,熟练掌握至少一种主流编程语言(包括但不限于C/C++/Java/Python/Golang)。
3. 对大模型数据有浓厚的研究兴趣,创新意识强,愿意拥抱新鲜事物。
4. 出色的问题分析和解决能力,自主探索新解决方案的能力强,良好的沟通协作能力。
5. 对数据开发、分析、挖掘领域有兴趣和热情,有志于在大数据领域长期发展。

工作职责


1. 负责AI平台大数据架构演进以及推进落地:根据不同领域场景大模型落地需求,与算法团队和IT基础设施团队紧密合作,提出大模型训练和优化数据规模、数据类型、数据结构等建议,确保架构有效实施。
2. 负责搭建大模型数据平台:支撑大模型数据的存储、预处理(去重、相似度计算、脱敏等)诉求,针对大模型场景、数据类型、数据规模具有高扩展性,以支持大模型数据集持续迭代,实现高质量数据集沉淀,确保数据安全和隐私保护。
3. 与算法团队紧密协作,抽象研发诉求,落地为便捷实用的的平台能力,提升整个团队的工作效率和数据处理能力。
包括英文材料
学历+
机器学习+
算法+
数据结构+
C+
C+++
Java+
Python+
Go+
大模型+
大数据+
相关职位

logo of alibaba
社招3年以上技术类-数据

1、参与大模型数据平台架构设计与开发,为大模型数据资产建设管理提供平台支持,支持数据资产上架、知识生产、检索、训练应用等;数据用途上包含预训练数据、微调数据、评测数据等,数据模态上包含文本、图片、视频、音频等各类模态数据。 2、参与高可用、可扩展、分布式大模型评测平台架构设计与开发,支持多模型、多方法、多评测集的评测任务执行、评测结果分析,优化评测框架,提升评测效率,支持实现大模型快速迭代的评测要求。 3、在通用BenchMark基础上构建业务领域Benchmark,围绕“语料供给-模型迭代-模型评测”的链路不断优化链路,提升生产效率。 4、持续的创新和优化能力,提升产品整体质量,改善用户体验。

更新于 2025-06-30
logo of baidu
社招1年以上ACG

-研发大规模分布式计算系统,包括高吞吐的批量计算、高时效的流式计算、高效能的OLAP等 -为全百度提供高性能、高可用、低成本的大数据计算服务 -探索新架构、新技术、新硬件,设计面向大模型的数据处理引擎和服务 -深入理解业务系统,理解项目客户需求,设计和实现符合用户需求的大数据平台系统,确保项目顺利验收

更新于 2025-06-09
logo of baidu
社招ACG

-设计、实现和维护数据基础设施系统,如分布式计算、数据编排、分布式存储、流式计算,同时确保可扩展性、可靠性和安全性 -确保我们的数据平台能够可靠地扩展到下一个数量级,满足业务对海量数据的计算/存储/检索/分析需求 - 建设面向大模型的数据基础设施平台,不断提升数据生产效率和数据质量,支撑大模型高效训练和性能优化

更新于 2025-02-13
logo of baidu
社招3年以上TPG

-和团队一起研发驱动AI进化的平台应用 -参与AI训练相关前端开发,研讨制定技术方案,确保高质量交付、提升产品用户体验 -通过开发工具/框架、封装组件、改进流程,保证前端开发的高效性,提高团队开发效率和质量 -关注AIGC技术前沿,及时把新技术转化为业务开发中的生产力

更新于 2024-09-18