
同花顺策略算法研究员
任职要求
具备扎实的数学与计算机基础,精通机器学习、深度学习及量化投资算法,熟悉计算机视觉(CV)、AIGC、自然语言处理(NLP)、强化学习(RL)等技术。 具有量化投资领域的工作经验,熟悉量化策略的开发、回测与优化,能够独立设计和实现基于大模型的量化投资系统。 在CVPR、ECCV、ICCV、NeurIPS、ICL…
工作职责
跟踪并深入研究LLM(大语言模型)领域的最新科研成果及业界动态,探索其在金融投资中的应用。 参与基于大模型的量化策略设计与算法开发,涵盖信号生成、组合优化、模型训练等环节,利用大模型、多模态技术和强化学习(RL)推进AI投资和AIGC项目。 优化大模型在金融场景下的推理效果,结合DPO(决策过程优化)和RLHF(强化学习与人类反馈)提升策略的稳定性与准确性。 参与投资Agent系统的开发,全面实现数据获取、分析、决策与执行的自动化链路,提升量化投资决策效率。 持续跟踪AI4Finance前沿技术,特别是多模态金融大模型、低延迟推理等领域的最新进展,为量化投资系统提供技术支持。
1.智能数据应用:多维度玩家数据挖掘和分析,构建预测、推荐、投放等模型; 2.AIGC技术落地:深度应用LLM、TTS等相关技术,结合业务场景进行落地; 3.跟踪并研究最新的AI技术和趋势,将其应用于游戏Al项目中。
1. 开发基于机器学习的机器人控制策略,完成机器人端对端的算法训练与部署; 2. 负责算法策略的训练与移植部署,实现算法sim2real在机器人实机上落地应用; 3. 持续跟踪国内外前沿研究成果,并进行相关算法复现,参与相关方向的论文与专利积累。 【课题名称】 机器人强化学习算法研究 【课题内容】 追踪当下前沿机器人强化学习算法,复现并创新。
职位概述 我们正在寻找在视觉-语言-动作(Vision-Language-Action, VLA)领域具有扎实理论基础和丰富实践经验的算法工程师或研究员,致力于构建下一代通用智能机器人系统。你将参与从数据构建、模型设计到仿真训练与实机部署的全链路研发,推动 VLA 大模型在机械臂操作、人形机器人控制等复杂工业与开放场景中的前沿探索与实际落地。 职位描述(Responsibilities) 1. 前沿算法研究与复现 ○ 跟踪 VLA 领域最新进展(如 OpenVLA、RT-2、Pi0、RDT、Diffusion Policy 等),完成 SOTA 算法在仿真与实机环境下的复现与性能分析; ○ 探索基于大模型的端到端机器人决策框架,实现感知→理解→规划→动作的闭环。 2. VLA 模型架构设计与优化 ○ 设计面向工业场景的 VLA 模型结构,重点解决多模态特征对齐、动作序列生成、推理效率优化等问题; ○ 提升机械臂在复杂任务中的操作精度、泛化能力与鲁棒性。 3. Scaling 研究与泛化能力提升 ○ 开展 VLA 的 scaling law 研究,涵盖数据规模、模型结构、机器人构型等维度; ○ 实现长序列任务执行、跨任务技能迁移与动作泛化,在更复杂的工厂或开放环境中验证模型上限。 4. 数据系统与自动标注开发 ○ 参与多模态大模型所需的数据清洗、自动标注与增强系统的开发; ○ 探索高效的数据合成方法(如 sim2real 数据生成、LLM 辅助标注),保障数据质量与多样性。 5. 仿真训练与真实部署 ○ 基于 Isaac Sim / Gym / Lab、MuJoCo 等平台搭建高保真仿真环境,构建强化学习与模仿学习训练框架; ○ 设计 real2sim2real 迁移策略,加速算法从仿真到现实世界的部署; ○ 具备实机调试经验,能独立完成模型在机械臂或人形机器人上的部署与迭代。