logo of tongyi

通义研究型实习生-基于代码库级智能体强化学习的图数据库测试预言机自动生成与验证系统

实习兼职通义研究型实习生地点:北京 | 杭州状态:招聘

任职要求


必备条件:
1、在读硕士/博士,计算机科学、软件工程、人工智能、数据科学或相关专业。
2、熟练掌握 Python,且至少熟练掌握一种强类型语言(如 C++/Java/Rust);具备中/大型代码库的实际开发与协作经验。
3、在以下任一方向具备系统性的深入理解并有可展示成果:数据库系统(优先图数据库)、编译原理、程序分析、软件测试。
4、具备图数据库、查询优化或图算法的科研或工程实践经验。
5、英文能力优秀:能高效阅读并复现英文论文,能够独立完成英文技术写作(技术报告/论文)。

加分条件:
1、熟悉强化学习或大语言模型微调(如 PPO、RLHF、DPO),并有相关课程、项目或实习经历。
2、具备静态分析、程序验证或代码知识图谱构建经验。
3、在国际顶会/期刊(如 SIGMOD、VLDB、ICDE、ASE、NeurIPSICLR 等)发表论文,或拥有有影响力的开源项目/贡献。

工作职责


1、研究与算法实现:
(1)参与图数据库代码知识图谱的构建与优化,借鉴最新的 RepoAudit 等研究成果。
(2)设计并实现基于强化学习(RL)的探索与反馈循环,包括智能体、动作空间、奖励机制。
(3)实验和优化多种RL策略(如PPO、DPO、GRPO、DAPO、GSPO)在真实图数据库测试场景的应用。
2、系统开发与实验:
(1)构建可编译运行的图数据库测试平台,负责自动化测试流程(提出预言机→生成用例→执行验证→反馈奖励)的实现。
(2)针对开源图数据库(NeuG、Neo4j、RedisGraph、NebulaGraph等),验证并提交新型逻辑错误。
3、论文与成果输出:
(1)参与撰写技术报告和学术论文,总结测试预言机生成的新方法与实验结果。
(2)协助开源端到端研究原型及技术文档的完善与维护。
包括英文材料
数据科学+
Python+
C+++
Java+
Rust+
算法+
强化学习+
NeurIPS+
编译原理+
RLHF+
相关职位

logo of aliyun
实习阿里云研究型实习

我们正在寻找对人工智能、多模态数据处理、系统性能优化感兴趣的实习生,参与一个面向多模态数据获取、解析、压缩与高效传输的研究课题。该课题聚焦于提升多模态系统在复杂环境下的实时性表现与资源利用率,具有广泛的应用前景(如智能运维、RAG检索增强生成、边缘计算等)。你将参与的工作包括但不限于: 1. 多模态数据采集与预处理:从网页、API、数据库、摄像头、麦克风等来源获取文本、图像、音频和视频数据; 2. 多模态数据解析与特征提取:使用OCR、ASR、NLP、CV等技术解析不同模态内容; 3. 模型轻量化与加速:探索基于Transformer、CNN、LSTM等模型的压缩、蒸馏、量化方法; 4. 系统级优化与部署:设计低延迟、低资源占用的数据处理流程,支持在边缘设备上运行; 5. 性能评估与实验分析:构建测试集,评估系统的吞吐量、响应时间、准确率等关键指标; 6. 撰写技术文档与研究报告:整理实验过程、结果与改进建议。 技术要求(优先但不强制): 1. 熟悉Python编程语言,有良好的代码规范; 2. 了解基本的NLP、CV或语音识别技术; 3. 掌握至少一种深度学习框架(PyTorch/TensorFlow); 4. 熟悉Linux系统及常用命令行工具。 有以下经验者优先考虑: 1. 多模态任务处理经验(如CLIP、Flamingo等); 2. 模型压缩与部署经验(如TensorRT、ONNX、OpenVINO、TVM等); 3. 使用过音视频处理工具(如FFmpeg、OpenCV、Whisper、YOLO等); 4. 有一定系统编程能力(C/C++、CUDA、FPGA基础)。

更新于 2025-07-02
logo of tongyi
实习通义研究型实习生

大模型(LLMs)基于自然语言的数学推理无法保证过程准确,本项目主要是基于大模型的Lean语言数学证明系统研究,具体职责包括: 1.基于数学证明题目,开发Lean数据集的构建算法; 2.基于监督微调,强化学习等技术,开发基于LLM的Lean Prover训练测试算法; 3.研究和大模型 Lean Prover相关的前沿技术; 4.撰写论文,技术文档,以及维护代码库。

更新于 2025-03-21
logo of aliyun
实习阿里云研究型实习

基于 RDMA/CXL 技术的分布式数据库性能优化研究,具体职责包括: 1. 参与基于RDMA/CXL技术的PolarDB for PostgreSQL分布式数据库的优化与实现,降低数据同步延迟和提升内存访问效率; 2. 构建并测试RDMA/CXL优化原型系统,确保其在高并发、低延迟场景下的性能优势,并根据实验结果进行迭代优化; 3. 与团队成员紧密合作,共同探索RDMA/CXL技术在分布式数据库中的最佳实践,推动技术创新与应用; 4. 负责制定详细的性能测试计划,分析原型系统的性能瓶颈,并提出有效的优化策略。

更新于 2025-07-02
logo of aliyun
实习阿里云研究型实习

职位描述: 1、参与Agent系统的原型构建与落地,探索提升Agent自主理解、规划与执行任务能力的新思路与方法; 2、优化Agent的对话交互机制,尝试新颖的交互方式,以提升用户体验和任务完成的流畅性与智能性; 3、研究并实验Agent的知识整合与上下文记忆管理方案,探索更高效、智能的信息组织与检索技术,支持Agent进行更深层次的思考; 4、探索Agent与系统工具、API的智能协同策略,参与设计和验证更鲁棒、灵活的工具调用与任务规划流程,鼓励提出创新交互方案; 5、针对特定复杂场景,调研并实践Agent解决用户实际问题的创新路径,挑战并拓展Agent的能力边界。

更新于 2025-07-02