阿里云研究型实习生 - 通算智算一体化性能分析诊断方法与深度优化
任职要求
1. 扎实的计算机科学与工程功底,优秀的编程能力(精通或熟练掌握C/C++/Python等),熟悉常用数据结构、算法和设计模式,具备复杂系统设计、开发与调试经验。 2. 优秀的沟通表达、团队协作能力;具备快速学习新知识和深入钻研复杂技术问题的能力与耐心。 3. 深入理解计算机体系结构(CPU/GPU/NPU等)、操作系统、编译原理、分布式系统等基础知识。 4. 具备以下至少一个领域的深入实践经验: ·高性能计算(HPC),特别是异构计算环境下的性能分析与优化。 ·GPU编程与优化(如CUDA, ROCm, OpenCL等),熟悉GPU架构。 ·系统性能分析与调优工具(如perf, eBPF, VTune, Nsight Profiler等)的开发或深度使用经验。 ·虚拟化(KVM/QEMU等)、容器技术(Docker/Kubernetes等)及其性能优化。 ·分布式系统调度与资源管理(如YARN, Mesos, Kubernetes Sche…
工作职责
1. 探索通算智算一体化场景下,端到端性能分析诊断体系的研究与构建,覆盖从底层硬件(CPU、GPU、NPU等)、系统软件到上层分布式框架和应用负载。 2. 深入研究CPU-GPU异构计算系统、分布式框架、系统软件栈(如操作系统、编译器、运行时)的性能瓶颈,提出并实现创新的软硬件协同优化方案。 3. 开发和落地先进的性能监控、剖析和诊断工具,支持从底层硬件指标到上层业务负载的全链路追踪与精准瓶颈定位。 4. 针对大规模AI模型训练/推理、通用计算等多样化负载,探索和实践GPU等异构资源的调度优化、资源容错、任务状态保存/恢复与快速迁移等关键技术,提升资源利用率和系统稳定性。 5. 研究内存(包括CPU内存和GPU显存)与计算的协同优化方案,旨在提升训推场景性能,降低整体成本,并优化资源利用率。 6. 将研究成果应用于阿里云平台及相关产品服务,提升云平台的整体性能、资源利用率和性价比,支持关键业务场景。 7. 在顶级学术会议和期刊上发表研究成果,并积极参与开源社区合作与技术推广,提升团队和公司在相关领域的技术影响力。
【岗位定位】Job Overview 1、本岗位面向具备跨媒介思维与系统设计能力、0到1创新落地能力的综合型设计人才,聚焦未来人形机器人在造型系统、视觉语言、人机感知交互体系、行为准则等维度的全链路设计构建与表达; 2、作为未来机器人设计团队的核心人才储备,该岗位以培养跨界创新思维与系统化问题解决能力为目标,支持从概念建构到落地实现的完整设计链路; 3、欢迎对未来智能物种与人机关系充满探索热情,具备跨领域实验精神,并希望建立“设计 × 技术 × 表达”复合能力模型的创意型人才加入。让我们在算法逻辑与美学逻辑交汇的前沿,共同探索面向未来的人形机器人设计方法论。 What You Will Do 1、参与人形机器人整机多维度的设计探索,涵盖造型、交互、行为、视觉语言等维度; 2、运用 编程交互 / 软硬件连接 / 实时动捕 / 3D 动态表达 等手段,支持机器人原型开发、功能验证与行为演示; 3、与结构工程、感知算法、人机交互、产品规划与研发等部门共建设计驱动方案,推进设计与工程之间的平衡与美学体验,实现人文艺术与科技的高度结合; 4、参与人机交互相关的设备调通、HRI参数调试、高质量算法数据采集与测试,协助构建跨媒介响应原型; 5、针对未来人形机器人语义、美学、体验趋势开展前瞻性研究与创意提案输出; 6、支持产品传播与对外展示场景,包括视觉语言、界面风格、产品图形等 touchpoint 设计。 【你将获得】What You'll Gain 1、深入机器人、人工智能领域的机器人产品部门实习机会; 2、与robotics专家们、结构工程师们合作,思维产生激烈碰撞的创新环境; 3、有机会参与令人激动的下一代人形机器人的本体设计和开发工作,获得相关经历。 【我们是谁】About Us 1、国内最早专注于人形机器人研发的团队之一,持续深耕于产品系统设计与体验创新领域; 2、拥有中美双团队架构,硅谷与国内核心团队并行协作,形成技术与设计并重的创新氛围; 3、一个追求极致效率、勇于打破边界、致力于以设计驱动体系革新的团队。 【我们的优势】Our Advantages 1、依托小鹏的技术与产业资源优势; 2、直接参与新一代人形机器人造型与交互研发; 3、快速验证创意到可制造产品的完整链路; 4、团队文化开放、务实、专注于结果与成长。
研究领域: 人工智能 项目简介: 实时语音交互在大模型应用落地中对于提升用户对话体验,提升用户留存(豆包app加入语音对话后留存率提升明显)具有重要作用;在AI硬件领域(AI眼镜、戒指等),实时语音交互是直接的、天然的交互方式,且对语音理解的准确率、语音生成的自然度、对话准确率、交互响应速度都有较高的要求
研究领域: 人工智能 项目简介: 在大模型的国际化应用落地过程中,要解决几个核心的问题: 1. 大模型对于小语种的支持:在蚂蚁国际化场景中,既有中英文这样的大规模使用的语言,也有东南亚,欧洲,非洲等各的确相对较小语种的实际需求,这些小语种的语料相对而言获取难度高,也导致了大模型在应用落地过程中会遇到许多困难,探索一条高效可行的道路来扩充大模型对于小语种的支持是在业务和技术上都有着突破意义的工作 2. 大模型对于体验的支持:在模型的使用过程中,探索更好的用户体验需要进行相当的投入来保持对于体验的关注和不断尝试,既包括通过推理模型来提升模型回复能力,也包括通过长思考能力来提升问题解决的思路完备性,也可以借助于大模型的代码生成等推理能力来生成交互式界面,或者通过多模态模型来进行包括视频在内的AIGC等,在应用过程中有很多细节需要结合大模型基座进行优化 3. 模型可信:在金融场景中,模型回复的准确性和安全性至关重要,结合业务场景进行探索模型的grounding,知识注入和幻觉消除等工作