logo of tongyi

通义研究型实习生-通义千问Agent研究

实习兼职通义研究型实习生地点:北京 | 深圳状态:招聘

任职要求


1. 计算机及相关领域的扎实算法和学术背景;
2. 对强化学习(RL)和智能Agent有浓厚兴趣,具备相关理论知识;
3. 代码能力强,具备深度学习框架(如PyTorch)的实践经验;
4. 对基座大模型及其应用充满热情;
5. 加分项:熟悉RL算法Agent框架;
6. 加分项:曾在计算机顶级会议上发表论文。

工作职责


专注于Agent框架及系统(如DeepResearch等)的研究、探索和开发,具体职责包括:
1. 参与设计和开发基于Qwen模型的智能Agent系统;
2. 研究和实现最新的强化学习(RL)算法,进行实验、训练和调优;
3. 协助团队进行数据收集、环境建模以及Agent的评估与测试;
4. 撰写研究文档、技术报告等,共同打造行业知名度和技术影响力。
包括英文材料
算法+
强化学习+
AI agent+
深度学习+
PyTorch+
大模型+
相关职位

logo of alibaba
实习淘天集团2026

1. 探索移动终端场景下及企业级效能产品下的Agent应用工程技术,创新研发实现Agent相关主流框架; 2. 开发大模型相关的知识图谱应用、思维框架等与大模型进行有效交互的模块,特别是在自主决策、任务规划上的探索; 3. 开展对通用Agent、个性化Agent的开发应用,应用的MCP 化改造,解决移动终端场景下的工程师体验问题、效率问题,提升工程师日常开发效率; 4. 协同业务、产品团队,实现从需求分析到技术方案设计落地等关键环节,实现Agent能力与业务场景的深度融合; 5. 持续关注AI领域最新进展,研究Agent领域的前沿技术(如ReAct、COT、MCP等多智能体协作),并推动工程场景落地与性能优化。

更新于 2025-05-07
logo of alibaba
实习淘天集团日常实习

1. 探索移动终端场景下及企业级效能产品下的Agent 应用工程技术,创新研发实现Agent 相关主流思维框架; 2. 开发大模型相关的数据知识图谱应用、CodeWiki、MCP等与大模型进行有效交互的数据模块,特别是在有利于大模型进行有效经验吸收的知识; 3. 开展对通用Agent、个性化Agent的开发应用及能力评估,不断增强领域Agent的能力,解决移动终端编码辅助场景下的研发效率问题,提升淘宝终端需求交付效率; 4. 协同业务、产品团队,实现从需求分析到技术方案设计落地等关键环节,实现Agent能力与业务场景的深度融合; 5. 持续关注AI领域最新进展,研究Agent领域的前沿技术(如ReAct、COT、A2A等多智能体协作和交互模式),并推动工程场景落地与性能优化。

更新于 2025-06-10
logo of aliyun
实习阿里云研究型实习

专注于LLM post-training和agent相关算法研究,具体职责包括: 1、探索LLM可解释性 + 模型增量CPT/RL算法,提升语言模型在专业领域上的能力; 2、探索LLM可解释性 + 低比特量化算法,降低模型training/inference阶段计算成本; 3、探索agent 增强微调算法,提升模型在专业领域上端到端解决复杂任务的能力; 4、将相关算法研究成果发表在国际顶级会议上(ICLR/NeurIPS/ICML/ACL); 5、将相关算法研究成果应用于模型低比特量化、海外大模型业务中,显著提升阿里云通义千问模型服务效率和沙特等国家主权大模型线上效果。

更新于 2025-04-23
logo of aliyun
实习阿里云研究型实习

专注于LLM post-training和agent相关算法研究,具体职责包括: 1、探索LLM可解释性 + 模型增量CPT/SFT/RL算法,提升语言模型在专业领域上的能力; 2、探索LLM可解释性 + 低比特量化算法,降低模型training/inference阶段计算成本; 3、探索agent 增强微调算法,提升模型在专业领域上端到端解决复杂任务的能力; 4、将相关算法研究成果发表在国际顶级会议上(ICLR/NeurIPS/ICML/ACL); 5、将相关算法研究成果应用于模型低比特量化、海外大模型业务中,显著提升阿里云通义千问模型服务效率和沙特、日本等国家主权大模型线上效果。

更新于 2025-10-09