
同花顺Agent算法实习生
任职要求
学历专业: 计算机科学、人工智能、电子工程等相关专业的硕士或博士在读生,特别优秀的本科生也可考虑。 编程与算法基础: 熟练掌握Python和PyTorch/TensorFlow框架,具备扎实的数据结构和算法基础。 计算机视觉基础: 对计算机视觉基础任务(如分类、检测、分割)和深度学习模型(CNN, Vision Transformer)有深入理解。 研究与实践热情: 对视频生成、多模态大模型、AI Agent等方向有强烈的兴趣和好奇心,具备出色的解决问题和自主学习能力。 团队协作精神: 具备良好的沟通能…
工作职责
视频理解与表征学习: 参与研究和实现基于Transformer、Diffusion等先进架构的视频理解模型,用于视频场景理解、动作识别、事件预测等任务。 视频生成与控制: 协助探索视频生成模型(如Video Diffusion Models, Sora-like architectures),并研究如何通过自然语言或高级指令(如Agent规划)实现对生成内容的精准控制(如控制物体运动、摄像机视角等)。 Agent决策框架搭建: 参与构建视频领域的AI Agent框架,使其能够根据指令(如“生成一个宇航员在月球后空翻的视频”)自动进行任务分解、调用合适的模型(如生成、编辑、特效模型)并执行多步规划。 仿真环境与评估体系: 参与构建或利用视频仿真环境,用于训练和评估Video Agent的决策能力。设计和开发定量与定性相结合的评估方案,以衡量生成视频的质量和Agent任务完成的准确度。 技术调研与原型验证: 紧跟视频生成、世界模型、AI Agent等领域的最新学术进展(如CVPR, ICCV, NeurIPS等顶会论文),并快速进行代码复现和实验。
1、刷新LLM Agent的能力边界,效果达到世界领先水平; 2、专注于大语言模型(LLM)的前沿技术研究,包括但不限于Pretrain、CPT、SFT、RL,Agent等方向; 3、发表ICLR、COLING、ICML、NeurIPS等顶会论文。
我们诚邀具备扎实算法功底与研究潜力的优秀应届毕业生加入,围绕前沿 Agent 技术的进行探索与应用落地,共同推动智能体技术的发展,您将深入参与: 1. Agent 学习与优化:研究并实现前沿 Agent 训练算法,包括但不限于模仿学习、强化学习等,提升 Agent 的自主决策能力; 2. Agent 架构与能力建设:涵盖 Planning、知识检索、工具调用、长短时记忆等核心模块的设计与优化,构建高智能可扩展的 Agent 框架; 3. 多模态交互与理解:基于 LLM 与多模态技术,构建面向复杂场景的智能体交互系统,实现自然的人机协作; 4. 场景化应用与创新:深度结合业务需求,设计适配不同领域的专业 Agent,打造具备长期价值和强劲竞争力的智能助手产品。
1. 深入探索LLM在深度推理、深度研究(Deep Research)、Code Agent等领域的技术研究,推动AI技术在实际应用中的突破; 2. 立足Multi-Agent应用体系,优化Multi-Agent自动构建、Agent通信语言、Memory机制、Reflection机制等算法方案。 3. 探索工业级的Multi-Agent强化学习算法方案,提升Multi-Agent系统的执行效率和结果对齐准确度。在创新应用场景中,优化长上下文场景的推理算法架构,探索System2技术边界。 4. 与团队成员紧密合作,作为应用算法同学,完成论文产出,同时确保研究成果能够无缝集成到现有创新产品中。