logo of aliyun

阿里云研究型实习生 - 面向异构数据融合处理的硬件加速关键技术研究

实习兼职阿里云研究型实习生地点:杭州状态:招聘

任职要求


1)扎实的工程能力,优良的编程风格,熟悉C++语言和常用设计模式,具备复杂系统的调试与开发能力;
2)优秀的沟通表达能力、团队合作意识和经验;具备快速学习的能力,以及深入钻研技术问题的决心;
3)掌握数据库领域优化/执行/存储等各方向基础知识,有扎实的高性能计算(GPU/x86/等)、高性能索引、或多模态数据分析领域的经验。

加分项:
1)有突出的学术背景和创新研究能力,在顶会顶刊发表过相关论文;
2)对数据库系统特别是实时数据分析/湖仓分析/硬件加速某一个方面有专业独到的研究。

工作职责


随着数据量的爆炸性增长以及业务复杂性的增加,诸如图、文档、时空、时序等非结构化数据类型规模和价值都越发重要。需要研究更有效率的非结构化数据的处理、存储、分析的技术,尤其是与结构化数据融合进行分析的手段,将来自不同来源、格式、结构或模型的数据整合到一个统一的系统中,以实现数据共享、分析和决策支持。 

我们的研究内容包括:
1. GPU加速的多模态数据处理,如fts、向量检索以及索引建立。GPU高效池化以及远程GPU调用,查询算子以及后台数据重整任务的高效远程GPU卸载;
2. 非结构化数据,如json、文档等自动语义发现与解析、数据模式匹配与语义对齐、对象关联分析。结合NLP等技术,实现从原始数据到结构化语义的高效转化;
3. OLTP高效入湖。结合数据湖的灵活性(存储非结构化数据)与数据仓库的结构化管理能力(如ACID、事务支持、元数据管理),通过存储层创新、计算引擎优化和云原生技术,实现不同业务的高效协同。
包括英文材料
C+++
设计模式+
数据分析+
相关职位

logo of aliyun
实习阿里云研究型实习

推荐系统已成为面向用户的互联网APP不可或缺的核心功能,尤其在电子商务、社交网络和娱乐平台等行业中发挥着至关重要的作用。面对用户群体的持续扩张和推荐系统复杂度的增加,推荐系统在处理大量并发请求和优化响应时间方面遇到了显著挑战。当前,很多推荐系统在处理庞大的用户数据和复杂的多模态输入时,常常受限于并发处理能力和响应速度的不足。本项目旨在优化推荐系统的吞度和响应优化时间,通过gpu embedding算子优化,xla编译优化等技术提升高并发GPU/CPU异构环境下的训练和推理性能。

更新于 2024-07-25
logo of aliyun
实习阿里云研究型实习

1. 在AI/HPC突发流量激增的背景下,探索软硬件协同设计新的方法,重构软硬件功能边界,实现异构计算资源的深度融合与动态适配 2. 多核协同调度机制:构建基于资源感知的动态调度算法,建立多维约束条件下的最优任务分配模型 3. 关键性能瓶颈突破:重点攻克时延抖动抑制、缓存资源动态分配等核心挑战,建立面向服务质量保障的调度优化框架;

更新于 2025-02-08
logo of bytedance
实习A96776

团队介绍:广告业务原为商业产品与技术部门,为抖音集团的商业变现提供广告产品与技术,负责端到端大型广告系统建设,覆盖抖音、今日头条、西瓜视频、番茄小说、穿山甲等产品矩阵,践行"激发生意新可能"理念,致力于让营销更省心、更高效、更美好,推动商业的可持续增长,让不分体量、地域的企业及个体,都能通过数字化技术激发创造、驱动生意。连接广告主、用户及生态伙伴、成为开放共赢的全球最佳智能营销平台之一。在这里,你将投身建设面向未来的数字营销能力,接触到全球先进的商业产品架构、模型和算法,在互联网广告行业始终创新。 课题介绍: 1、核心技术架构: 1)下一代广告技术栈: 模型算法层:搭建基于强化学习的智能出价与流量预估系统,攻克深层转化场景下的数据稀疏、多源异构数据融合(延迟数据/埋点噪声/跨平台行为)等行业难题; 系统工程层:构建支持基于长序列特征的实时预估框架,研发支持动态创意组合的自动化投放引擎; AIGC融合层:建立文/图/视频多模态生成技术中台,实现从IP素材生成到智能投放的全链路闭环; 2)行业首创的AIGC解决方案: 正在搭建全球领先的"小说→漫剧"智能生产线,攻克三大技术堡垒: 多模态叙事引擎:研发支持角色一致性保持(Character-aware Diffusion)、分镜自动生成(Storyboard LLM)、动态运镜控制(Camera ControlNet)的复合型生成框架; 工业化工作流:构建支持分布式渲染、多版本AB测试、合规性审核的智能生产管线,实现日均千级素材产能; 投放增效系统:开发生成质量量化评估模型(QAGAN),建立素材生成-投放效果的反哺优化机制; 2、岗位挑战: 你将主导: 构建支持沿模型的混合推理框架,优化多卡并行下的生成效率; 设计跨模态对齐算法,提升文字指令到视觉元素的可控生成精度; 研发基于用户行为分析的智能素材变异系统,实现CTR提升30%+的个性化内容生成; 打造从内容生产到实时竞价的全自动化广告引擎; 3、我们期待这样的开拓者: 精通Diffusion Models技术栈,具有LoRA/ControlNet/T2I-Adapter等微调框架的实战调优经验; 熟悉多模态大模型(如VideoPoet、Sora等视频生成技术原理),具备跨模态表征学习研究背景; 拥有广告算法背景者优先,熟悉CVR预估、智能出价等核心模块与生成式AI的结合点; 出色的工程化能力,主导过至少一个完整AIGC项目的端到端落地(从模型训练到服务部署)。

更新于 2025-05-26
logo of antgroup
实习蚂蚁技术研究院长

职位描述: 1.面向异构计算、软件工程、安全隐私、绿色计算等方向,打造蚂蚁编译技术平台; 2.定义新的编译架构,打造新的编译生态,探索新的技术方向。