深度求索AGI实习生(北京)
任职要求
- 计算机及相关专业研究生,特别优秀的本科生亦欢迎申请 - 具有扎实的编程功底和DL/ML基础,熟练掌握 PyTorch - 能动性强,有强烈意愿做出高水平工作,愿意研究解决AI核心问题 - 追求极致和细节控,相比经验我们更看重你的潜力和上限 - 有顶级AI会议论文发表经验或开源项目贡献经验者优先 - 具有自然语言处理、计算机视觉、模型压缩和推理优化等领域经验者优先 我们的优势: - 顶尖GPU集群算力支持,快速迭代实验有影响力idea - 与研究和工程能力兼备的团队成员合作,专注兼顾实际效果和研究深度的AGI方向 - 丰厚的实习待遇(500元/天),非北京地区学生来京实习有租房补助(3000元/月) - 实习期间表现优秀者,可直接获得转正名额 公司简介: 我们相信 AGI 是模型x数据x算力的暴力美学,我们相信大模型是科研+工程+组织的优雅艺术。我们正在寻找并长期培养优秀的 AI 人才,与我们一起进行高水平的科学研究和工程实践。如果你对人工智能有浓厚的兴趣和扎实的基础,如果你想在一个充满挑战和机遇的初创环境中展现你的才华,如果你想与业界优秀的mentor共同快速学习和成长,如果你想找片沃土充分激发自己追求极致的能力和无限的潜能,那么请不要犹豫,加入DeepSeek,与我们共同在AGI征程上“深度求索”吧!
工作职责
实习内容: - 大型语言模型、多模态模型研究,包括模型预训练、理论研究、模型评估等 - 计算机视觉研究,包括视觉内容生成、开放场景视觉判别模型 - 大模型训练数据构建,训练策略迭代和调优,完整亲历大模型涌现能力出现全过程
我们是谁: 我们是阿里智能信息事业群,专注于AI to C的业务,为2亿用户群体提供AI服务,你或你身边的小伙伴中可能就是我们的用户。我们是一支致力于在AI赛道长期发展、创新务实的团队,欢迎每一位有想法、对AI有热情的小伙伴和我们一起参与这个令人激动的过程。 你会参与到: 1.与算法工程师携手深入探索大模型的底层原理,能够更好地理解数据与模型之间的关系,为模型训练提供更具针对性的标注策略,加速模型的优化与迭代。 2.深度参与数据与模型的交互过程,理解不同领域知识之间的关联和相互影响,从而拓展自己的知识边界,培养跨学科的思维能力,能够从多个角度理解数据、理解知识、理解智能。 3.通过对数据作为人工智能核心驱动因素之一的深刻理解和实战参与,进一步提升快速学习的能力、创新思维激发,对个人未来的职业发展中提供更多的可能性,进一步提升未来在职场的竞争力。
Qwen 团队致力于探索 AGI,目前我们正在全力朝着“多模态多任务的AI模型 / 系统” 以及“实现大模型智力飞升”两大目标展开研发,希望实现对用户及社会有益的 AI。Qwen 团队正在快速成长和发展中,希望招募顶尖的研究人员及工程师等来和我们一起实现梦想。 推理优化的工作目前主要关注高并发serving(Qwen WEB以及API服务)下的算法侧以及系统框架侧的探索与研发,主要针对Qwen系列模型, chat模型、vl模型以及audio模型。 算法侧的的优化主要包括两部分,一部分是训练推理协同优化;另一部分是post-training部分。 系统侧的优化主要职责是针对Qwen系列模型,优化系统推理性能达到最优。
在算力驱动的 AGI 和人文精神的烟火气交汇之处,我们真诚邀请对大模型 Omni Model 有热情的同学加入,共同打造更具影响力的智能系统。你会成为团队的一员,并和其他同事协作,共同研发 SOTA 的 Omni Model。期待你以务实和客观的科学态度来推进技术的进展,不被过往经验裹挟、不被主观偏好影响。期待你除了算法外仍然是为出色的工程师。期待你对技术有强烈的好奇心和开放心态。 区别于传统 ASR / TTS 级联技术,我们希望打造端到端的 Omni Model 在实时交互中释放大模型的智力水平,彻底改变以 Chatbot 文字为主的人机交互界面 岗位说明:你会负责围绕大模型 Omni Model 构建语音模态的相关研究工作,包括但不限于如下事项 海量的语音数据处理和构建:定性分析、定量评估数据质量,并给出 scalable 的改进方案;探索跨模态(文字/视觉/语音)混合训练的最佳实践; 探索更加高效且合理的模型架构,让模型更加理解音频,同时让模型具备更好的语音合成能力 研究并探索基于 Omni Model 的 Post Train,包含但不限于 SFT 和 RL