阿里巴巴数据技术及产品部-大模型数据研发专家-杭州
社招全职5年以上技术类-数据地点:杭州状态:招聘
任职要求
1.计算机、数学、统计、人工智能、大数据、机器人等相关专业硕士及以上学历,有数据算法相关实践经验,具备多模态/跨模态数据处理实践经验优先; 2. 有相关大规模分布式系统开发经验,熟悉主流大数据存…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.主导EB级海量全模态(文本/图像/视频/音频3D等)AI数据处理平台的规划,负责高性能、可扩展的数据处理架构设计; 2. 负责AI数据资产体系构建与AI数据资产规划,推动数据、算法、工程及产品等多团队协作,实现AI全模态数据标准化、流程化及资产化,加速AI数据在基模和AI应用之间效能转化; 3. 主导核心数据处理算子(清洗、加工、转换、融合)的研发与工程化落地,并构建高效的流程编排与执行引擎,支持百亿级数据在异构卡型上快速自动化处理; 4. 负责全域EB级检索引擎的架构设计与实现,包括多模态检索、内容检索与RAG(检索增强生成)等,并持续进行性能与效果优化; 5. 关注并引领AI数据处理领域的新技术、新架构、新工具,积极推动平台技术升级和平台开放,推动团队在AI数据处理能力提升和内部技术分享。
包括英文材料
大数据+
https://www.youtube.com/watch?v=bAyrObl7TYE
https://www.youtube.com/watch?v=H4bf_uuMC-g
With all this talk of Big Data, we got Rebecca Tickle to explain just what makes data into Big Data.
学历+
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
分布式系统+
https://www.distributedsystemscourse.com/
The home page of a free online class in distributed systems.
https://www.youtube.com/watch?v=7VbL89mKK3M&list=PLOE1GTZ5ouRPbpTnrZ3Wqjamfwn_Q5Y9A
还有更多 •••