同花顺Agent算法实习生

校招全职AI 算法类地点：杭州状态：招聘

扫码手机上打开

任职要求

学历专业： 计算机科学、人工智能、电子工程等相关专业的硕士或博士在读生，特别优秀的本科生也可考虑。

编程与算法基础： 熟练掌握Python和PyTorch/TensorFlow框架，具备扎实的数据结构和算法基础。

计算机视觉基础： 对计算机视觉基础任务（如分类、检测、分割）和深度学习模型（CNN, Vision Transformer）有深入理解。

研究与实践热情： 对视频生成、多模态大模型、AI Agent等方向有强烈的兴趣和好奇心，具备出色的解决问题和自主学习能力。

团队协作精神： 具备良好的沟通能…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

视频理解与表征学习： 参与研究和实现基于Transformer、Diffusion等先进架构的视频理解模型，用于视频场景理解、动作识别、事件预测等任务。

视频生成与控制： 协助探索视频生成模型（如Video Diffusion Models, Sora-like architectures），并研究如何通过自然语言或高级指令（如Agent规划）实现对生成内容的精准控制（如控制物体运动、摄像机视角等）。

Agent决策框架搭建： 参与构建视频领域的AI Agent框架，使其能够根据指令（如“生成一个宇航员在月球后空翻的视频”）自动进行任务分解、调用合适的模型（如生成、编辑、特效模型）并执行多步规划。

仿真环境与评估体系： 参与构建或利用视频仿真环境，用于训练和评估Video Agent的决策能力。设计和开发定量与定性相结合的评估方案，以衡量生成视频的质量和Agent任务完成的准确度。

技术调研与原型验证： 紧跟视频生成、世界模型、AI Agent等领域的最新学术进展（如CVPR, ICCV, NeurIPS等顶会论文），并快速进行代码复现和实验。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

算法+

Python+

PyTorch+

TensorFlow+

数据结构+

OpenCV+

还有更多 •••

登录查看完整学习资料

相关职位

Agent算法实习生

实习核心本地商业-基

1. 后训练研究：深入参与模型对齐工作，重点研究多种后训练算法；探索结果奖励和过程奖励模型的构建，提升模型在复杂逻辑下的推理能力。 2. Agentic RL优化：针对复杂业务场景，优化 Agent 的任务规划、反思与执行能力；提升模型在长链路任务中的稳定性和成功率。 3. 前沿技术落地：跟踪业界前沿技术路线，负责相关算法的复现、调优及在业务场景中的工程化落地。

更新于 2026-07-29北京|上海

Agent算法实习生

实习阿里巴巴日常实习

【团队介绍】 Accio是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品，Accio Work是阿里在海外落地的首个企业级AI Agent，通过持续探索Agent、Agent Harness、Post-training、RL、Memory等前沿技术，自研Agent模型、Agent系统，实现B2B AI Agent跨越式发展。我们拥有充足的计算资源（H100/B200 集群）、真实的大规模商业场景（覆盖海量活跃供应商与全球买家）、开放包容的研究氛围、高人才密度的团队指导。在这里，研究成果不仅能产出学术论文，还能直接作用于海量的真实B2B贸易场景。【研究课题】 Agent模型后训练、Agentic RL、Agent Harness、Massive and Test-time Agnostic Agentic Post-training等等，推动Agent技术发展与落地效果的课题均可探索立项；【岗位职责】（其一或多个均可） 1、Agentic RL 研究与训练：设计面向异步长程场景的 RL 方案，包括合成数据构造、奖励建模与模型训练，利用分布式框架（VeRL 等）进行大规模调优，产出 Novelty 和实用性兼具的工作； 2、Agent核心能力建设与优化：包括但不限于自主规划（Planning）、多步推理（Reasoning）、工具/skill调用（Tool Use）、长短期记忆（Memory）及 RAG 增强。研究长程任务分解、执行监控、自主纠偏、主动通知等 Agent 关键能力，推动成果在 Accio 业务场景落地； 3、Agent评测体系构建：搭建面向长程异步任务的评测基准，覆盖任务时间跨度、多轮交互、并发协调等现有 benchmark 未充分涵盖的维度；构建端到端的Agent评测体系，构建生产力场景benchmark，推动Agent在business场景落地； 4、Agent大规模后训练：参与构建针对 Agent 能力的训练数据及环境，利用分布式训练框架（如 Megatron-LM, verl）进行大规模模型调优; 5、复杂任务动态编排：设计并实现高扩展性的Multi-Agent协作框架（如Agent Swarm/Agent Team），支持将模糊的宏观目标递归拆解为原子任务； 6、Long-horizon运行设计：构建结合""工作记忆+全局知识库""的多级存储系统，解决Agent长期运行中的信息遗忘问题，建立跨Agent的共享上下文能力，设计Agent持续进化框架； 7、前沿追踪：Follow 最新的学术工作，例如复现 GAIA, BrowseComp, HLE 等最新测试集上的 SOTA 方案。

更新于 2026-05-18杭州

Agent算法实习生（J103893）

实习ACG

-深入科研和产业场景，将复杂需求转化为可求解、可执行、可验证的优化任务 -构建 Agent 可调用的数据接口、求解器、仿真器、checker 和自动评测环境 -结合 Agent、MIP/CP/SAT 和启发式算法，完成优化原型及 PoC -推动 Agent 自主完成问题分析、模型构建、算法生成、代码执行和结果迭代 -建立以可行性、解质量、运行效率、稳定性和业务 KPI 为核心的验证闭环 -将真实场景中的失败案例和有效策略沉淀为可复用的 Agent skill 与优化组件

更新于 2026-07-29北京

Agent算法实习生（EDA方向）（J103892）

实习ACG

-研究面向布局布线、DRC 修复和 PPA 收敛等问题的自演化 Agent -将 EDA 任务构造成具备明确动作空间、评价指标和验证器的算法搜索环境 -构建“方案生成—代码修改—工具执行—结果验证—经验沉淀”的 Agent 闭环 -设计长期轨迹记忆和策略迁移机制，提升 Agent 在不同设计与任务间的泛化性和稳定性 -探索 Agent 与 EDA 工具、MIP/CP/SAT 求解器及启发式算法的协同 -将成果沉淀为新算法、Agent skill、代码模块、技术文档或研究论文

更新于 2026-07-29北京