
同花顺强化学习算法研究员(金融大模型)
任职要求
具有扎实的强化学习理论基础,熟悉强化学习的核心算法(如DQN、PPO、A3C等),并有实际应用经验,能够根据金融问题设计适合的RL算法。 在金融量化、资产管理、风险控制等领域有丰富的经验,能够理解并解决金融数据中固有的不确定性与复杂性。 熟悉大模型,能够将这些先进技术应用到金融决策系统中,提升模型的性能和适应性。 具有扎实的编程能力,精通C/C++或Python编程语言,能够高效实现复杂算法,优化模型训练与推理效率。具备量化投资平台的开发或算法优化经验者优先。 有学术论文发表经历,尤其是在NeurIPS、ICLR、ICML等顶级会议上有论文发表者优先。 具备较强的创新能力,能够主动跟踪强化学习与金融大模型领域的最新发展,并能够独立解决复杂的算法问题。 加分项: 参与过大规模金融数据分析或量化策略开发,并有成功的应用案例。 熟悉AI在金融领域的法规与合规要求,能够在遵循合规框架的前提下开发创新算法。 在AI4Finance、量化金融等领域有实际的落地项目经验。
工作职责
参与金融领域大模型的设计与优化,特别是在量化投资、风险控制、资产配置等场景下应用强化学习算法(RL)解决实际问题。 研究和开发基于强化学习的金融策略,包括但不限于投资组合优化、市场预测、风险管理等关键领域。 利用大模型和多模态数据(包括市场数据、新闻数据、社交媒体数据等),开发适应金融市场动态变化的智能决策系统。 优化金融场景下强化学习模型的训练与推理效率,探索基于DPO(决策过程优化)与RLHF(强化学习与人类反馈)的创新算法,提升策略的稳定性和适应性。 深入研究AI4Finance前沿技术,关注低延迟推理、模型压缩、算法加速等技术的应用,推动金融大模型在实时交易、资产管理等领域的落地。

跟踪并深入研究LLM(大语言模型)领域的最新科研成果及业界动态,探索其在金融投资中的应用。 参与基于大模型的量化策略设计与算法开发,涵盖信号生成、组合优化、模型训练等环节,利用大模型、多模态技术和强化学习(RL)推进AI投资和AIGC项目。 优化大模型在金融场景下的推理效果,结合DPO(决策过程优化)和RLHF(强化学习与人类反馈)提升策略的稳定性与准确性。 参与投资Agent系统的开发,全面实现数据获取、分析、决策与执行的自动化链路,提升量化投资决策效率。 持续跟踪AI4Finance前沿技术,特别是多模态金融大模型、低延迟推理等领域的最新进展,为量化投资系统提供技术支持。

follow最新的LLM领域的科研及业界最新的成果,直接应用到金融投资。 1. 参与基于大模型的量化策略设计与算法开发,覆盖信号生成、组合优化、模型训练等环节 ,运用大模型\多模态\强化学习解决AI投资、AIGC等项目。 2. 优化大模型在金融场景的推理效果,结合DPO/RLHF提升策略稳定性 3. 开发投资Agent系统,实现数据获取-分析-决策-执行的自动化链路 4. 跟踪AI4Finance前沿技术(如多模态金融大模型、低延迟推理)

1. 参与文档解析多模态大模型的研发和迭代,研发高效的强化学习训练与推理系统,解决大规模图文数据处理、算力利用及模型优化问题; 2. 设计并实现适用于多模态大模型的奖励机制,涵盖图文对齐、复杂推理、OCR/文档解析、表格理解、视觉问答、Agent 操作等多模态任务,探索创新性强化学习算法与多模态对齐方法; 3. 构建并优化多模态强化学习流程,包括数据生成、奖励模型训练、策略优化(如 PPO / DPO / GRPO 等)、模型评测与部署,实现模型能力的精准量化与持续优化; 4. 结合业务需求提出创新方案,推动 RL 优化后的多模态大模型在办公自动化、教育、金融等领域落地应用。