logo of aliyun

阿里云研究型实习生 - 在数据链路上基于AI的根因分析和解决方案研究

实习兼职阿里云研究型实习生地点:杭州状态:招聘

任职要求


1、计算机或相关方向博士、硕士在读。扎实的工程能力,优良的编程风格,熟悉JAVA/Python/C++语言和常用设计模式,具备复杂系统的设计开发调试能力;
2、优良的沟通表达能力、团队合作意识和经验;具备快速学习的能力,以及深入钻研技术问题的耐心;
3、熟悉LLM技术(训练/推理/领域适配);
4、有突出的学术背景和创新研究能力;
5、对LLM等重点场景的系统优化或前沿算法有深入务实的经验。

工作职责


基于大模型(如通义千问)构建多因素(源库、目标库、源端网络、目标端网络、数据传输链路)根因分析与解决方案推建系统,并解决系统构建中的关键算法和技术,包括如下几方面:
1、设计合适的prompt,基于已有数据对模型finetune,并实现部署和线上应用;
2、构建知识库实现专家知识结构化,引入双向反馈通道,使能模型具备持续迭代能力;
3、与DTS工程团队一起上线系统,实现DTS线上异常任务自愈恢复。
包括英文材料
Java+
Python+
C+++
设计模式+
大模型+
算法+
相关职位

logo of amap
实习高德研究型实习生

业务丰富,技术领先 高德打车算法团队深度赋能打车业务全链路,涵盖 用户增长、风控、服务管控、路线与上下车点推荐、ETA 预估、智能客服 等核心场景。多样化的业务挑战为算法创新提供了广阔的发挥空间,团队已在 AI 顶级会议发表成果。 精英阵容,国际视野 团队成员来自泰晤士世界大学排名 Top 10 的高校,以及美国常青藤、清华、北大等顶尖院校,兼具国际化背景与一流技术视野。 持续成长,共享共进 团队每周固定进行技术分享,氛围开放、互助友好;除了解答算法与工程难题,资深同事还会分享项目经验,并传授业务理解与问题解决的方法论,助你快速成长。 我们正在寻找相关专业的优秀实习生,一同探索前沿大模型技术及推荐营销算法在共享出行领域的深度应用,共同攻克业界难题,优化产品体验。 在这里,你将参与高德共享出行核心业务的大模型技术落地、推荐营销算法建设等,包括但不限于: 大模型方向:将大模型技术深度应用在高德打车核心链路上,包括多模态大模型、AIGC、SFT、RLHF、高效推理等,提升平台效率和用户体验; 推荐营销方向:利用深度学习、基于大模型的下一代推荐营销算法等,基于海量用户数据,进行高德打车全链路的推荐营销算法构建和迭代,包括多任务学习、多场景建模、序列决策、因果推断建模、应答时长预测等; 在这里,你的算法将直接服务全国数亿级用户,带来真实而深远的影响;你能接触到前沿大模型、多模态、强化学习等核心技术,并与顶尖同事共创,在开放包容的创新氛围下,发挥AI创造力。

更新于 2025-09-25
logo of aliyun
实习阿里云研究型实习

基于硬件(不限于FPGA)的硬件数据压缩系统研发 1、基于硬件(不限于FPGA)的压缩代码,构建结构化、半结构化、非结构化的统一压缩方案; 2、基于新型硬件压缩代码构建线上运行demo,通过测试数据验证压缩率,保证数据质量,传输延迟和在规定范围内; 3、基于demo的代码把压缩程序嵌入到现有的网关组件,对经过DG传输的数据进行压缩传输。

更新于 2025-07-02
logo of aliyun
实习阿里云研究型实习

大语言模型在行业化实战落地的过程中,幻觉现象是一个非常重要的问题。该课题主要研究专业知识如何注入到基础大模型相关核心技术,通过pre-training/instruction tuning/RLHF解决大模型专业性问题、知识幻觉问题定位与缓解、沉淀领域知识图谱、领域工具(搜索/数据库等API)使用、多个大小模型融合等等核心技术问题。

更新于 2024-07-12
logo of aliyun
实习阿里云研究型实习

我们正在寻找对人工智能、多模态数据处理、系统性能优化感兴趣的实习生,参与一个面向多模态数据获取、解析、压缩与高效传输的研究课题。该课题聚焦于提升多模态系统在复杂环境下的实时性表现与资源利用率,具有广泛的应用前景(如智能运维、RAG检索增强生成、边缘计算等)。你将参与的工作包括但不限于: 1. 多模态数据采集与预处理:从网页、API、数据库、摄像头、麦克风等来源获取文本、图像、音频和视频数据; 2. 多模态数据解析与特征提取:使用OCR、ASR、NLP、CV等技术解析不同模态内容; 3. 模型轻量化与加速:探索基于Transformer、CNN、LSTM等模型的压缩、蒸馏、量化方法; 4. 系统级优化与部署:设计低延迟、低资源占用的数据处理流程,支持在边缘设备上运行; 5. 性能评估与实验分析:构建测试集,评估系统的吞吐量、响应时间、准确率等关键指标; 6. 撰写技术文档与研究报告:整理实验过程、结果与改进建议。 技术要求(优先但不强制): 1. 熟悉Python编程语言,有良好的代码规范; 2. 了解基本的NLP、CV或语音识别技术; 3. 掌握至少一种深度学习框架(PyTorch/TensorFlow); 4. 熟悉Linux系统及常用命令行工具。 有以下经验者优先考虑: 1. 多模态任务处理经验(如CLIP、Flamingo等); 2. 模型压缩与部署经验(如TensorRT、ONNX、OpenVINO、TVM等); 3. 使用过音视频处理工具(如FFmpeg、OpenCV、Whisper、YOLO等); 4. 有一定系统编程能力(C/C++、CUDA、FPGA基础)。

更新于 2025-07-02