
同花顺Agent算法实习生
任职要求
学历专业: 计算机科学、人工智能、电子工程等相关专业的硕士或博士在读生,特别优秀的本科生也可考虑。 编程与算法基础: 熟练掌握Python和PyTorch/TensorFlow框架,具备扎实的数据结构和算法基础。 计算机视觉基础: 对计算机视觉基础任务(如分类、检测、分割)和深度学习模型(CNN, Vision Transformer)有深入理解。 研究与实践热情: 对视频生成、多模态大模型、AI Agent等方向有强烈的兴趣和好奇心,具备出色的解决问题和自主学习能力。 团队协作精神: 具备良好的沟通能…
工作职责
视频理解与表征学习: 参与研究和实现基于Transformer、Diffusion等先进架构的视频理解模型,用于视频场景理解、动作识别、事件预测等任务。 视频生成与控制: 协助探索视频生成模型(如Video Diffusion Models, Sora-like architectures),并研究如何通过自然语言或高级指令(如Agent规划)实现对生成内容的精准控制(如控制物体运动、摄像机视角等)。 Agent决策框架搭建: 参与构建视频领域的AI Agent框架,使其能够根据指令(如“生成一个宇航员在月球后空翻的视频”)自动进行任务分解、调用合适的模型(如生成、编辑、特效模型)并执行多步规划。 仿真环境与评估体系: 参与构建或利用视频仿真环境,用于训练和评估Video Agent的决策能力。设计和开发定量与定性相结合的评估方案,以衡量生成视频的质量和Agent任务完成的准确度。 技术调研与原型验证: 紧跟视频生成、世界模型、AI Agent等领域的最新学术进展(如CVPR, ICCV, NeurIPS等顶会论文),并快速进行代码复现和实验。
1、刷新LLM Agent的能力边界,效果达到世界领先水平; 2、专注于大语言模型(LLM)的前沿技术研究,包括但不限于Pretrain、CPT、SFT、RL,Agent等方向; 3、发表ICLR、COLING、ICML、NeurIPS等顶会论文。
团队介绍: 高德语音技术部,是负责高德全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音内容生成、语音识别、多模态模型、模型服务与推理。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。 团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHg)https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHghttps://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHg) 具体职责: 围绕voice agent/speech language model的研究工作,包括但不限于如下事项: 跟进最领先的语音交互技术,包括但不限于提出新的技术框架、改进现有的算法、持续提升相关技术及业务指标,鼓励撰写论文及申请专利; 结合业务场景,探索跨模态(文字/语音/视觉)混合训练的最佳实践,探索基于speech language model的后训练(SFT+RL)技术,持续优化交互响应、交互内容,结合规划agent/工具调用agent,持续提升voice agent的交互体验,从而反馈到高德agent的整体能力; 探索流式全双工对话中,更加高效且合理的模型架构,包括但不限于COT Reasoning in streaming full-duplex等; 海量的语音数据,尤其是对话数据的处理构建:定性分析、定量评估、参与设计自动评估框架,研发 scalable 的改进方案,持续提升数据质量;
千问通用AI Agent团队致力于建设高度自主的AI Agent体系,我们诚邀具备扎实算法功底与研究潜力的优秀在校生加入,围绕前沿 Agent 技术的进行探索与应用落地,共同推动智能体技术的发展,你将深入参与: 1. Agent 学习与优化:研究并实现前沿 Agent 训练算法,包括但不限于模仿学习、强化学习等,提升 Agent 的自主决策能力; 2. Agent 架构与能力建设:涵盖 Planning、知识检索、工具调用、长短时记忆等核心模块的设计与优化,构建高智能可扩展的 Agent 框架; 3. 多模态交互与理解:基于 LLM 与多模态技术,构建面向复杂场景的智能体交互系统,实现自然的人机协作; 4. 场景化应用与创新:深度结合业务需求,设计适配不同领域的专业 Agent,打造具备长期价值和强劲竞争力的智能助手产品; 5. 追踪相关前沿技术,协助完成相关方向的效果评估、Benchmark测试,推动相关领域性能的不断提升;
我们诚邀具备扎实算法功底与研究潜力的优秀应届毕业生加入,围绕前沿 Agent 技术的进行探索与应用落地,共同推动智能体技术的发展,您将深入参与: 1. Agent 学习与优化:研究并实现前沿 Agent 训练算法,包括但不限于模仿学习、强化学习等,提升 Agent 的自主决策能力; 2. Agent 架构与能力建设:涵盖 Planning、知识检索、工具调用、长短时记忆等核心模块的设计与优化,构建高智能可扩展的 Agent 框架; 3. 多模态交互与理解:基于 LLM 与多模态技术,构建面向复杂场景的智能体交互系统,实现自然的人机协作; 4. 场景化应用与创新:深度结合业务需求,设计适配不同领域的专业 Agent,打造具备长期价值和强劲竞争力的智能助手产品。