同花顺强化学习算法研究员（金融大模型）

校招全职金融研究类地点：杭州状态：招聘

扫码手机上打开

任职要求

具有扎实的强化学习理论基础，熟悉强化学习的核心算法（如DQN、PPO、A3C等），并有实际应用经验，能够根据金融问题设计适合的RL算法。
在金融量化、资产管理、风险控制等领域有丰富的经验，能够理解并解决金融数据中固有的不确定性与复杂性。
熟悉大模型，能够将这些先进技术应用到金融决策系统中，提升模型的性能和适应性。
具有扎实的编程能力，精通C/C++或Python编程语言，能够高效实现复杂算法，优化模型训练与推理效率。具备量化投资平…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

参与金融领域大模型的设计与优化，特别是在量化投资、风险控制、资产配置等场景下应用强化学习算法（RL）解决实际问题。
研究和开发基于强化学习的金融策略，包括但不限于投资组合优化、市场预测、风险管理等关键领域。
利用大模型和多模态数据（包括市场数据、新闻数据、社交媒体数据等），开发适应金融市场动态变化的智能决策系统。
优化金融场景下强化学习模型的训练与推理效率，探索基于DPO（决策过程优化）与RLHF（强化学习与人类反馈）的创新算法，提升策略的稳定性和适应性。
深入研究AI4Finance前沿技术，关注低延迟推理、模型压缩、算法加速等技术的应用，推动金融大模型在实时交易、资产管理等领域的落地。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

强化学习+

算法+

大模型+

C+

C+++

还有更多 •••

登录查看完整学习资料

相关职位

大语言模型算法研究员(北京)(上海)

社招CSIG技术

1.负责大语言模型的算法研发与优化，包括继续预训练、指令微调（SFT）、强化学习对齐（RLHF/DPO）、智能体等环节的技术探索； 2.推动LLM在垂直领域（如智能客服、金融分析、电商场景）的落地应用，设计多轮对话、逻辑推理、函数调用等能力优化方案； 3.跟踪学术界与工业界最新进展，推动创新技术在产品中的集成应用。

更新于 2025-06-13深圳

见习AI搜索大模型对齐研究员

校招策略算法

我们是谁？重塑亿万用户的搜索体验：成为小红书的AI搜索模型核心塑造者！加入小红书AI搜索大模型的革命性研发进程，你将亲手调教AI，运用深厚的专业学识（物理、数学、科技数码、医疗健康等），赋予AI更专业、更温暖、更有趣的灵魂和表达。从源头构建训练数据，到精准诊断模型回答，再到通过前沿强化学习技术影响模型的行为风格——你的智慧，将直接定义数亿用户每一次搜索的答案质量与体验深度。在这里，你塑造的不只是模型，更是下一代搜索体验的未来！你会来做什么？ 1、成为AI的“知识灵魂工程师”与“人格设计师”：匠心打造精通领域（如物理、数学、科技数码、医疗健康等）的高质量问答语料（专业、有趣、人性化），为AI注入专业深度、人性温度与独特趣味。 2、化身专业“诊断师”：深度剖析AI回答，精准识别事实、逻辑、专业度、人文关怀及风格上的偏差，提供建设性修改意见与结构化评分。 3、驱动模型进化：参与强化学习训练（如RLHF），你的专业反馈直接驱动模型迭代，塑造AI的回答效果、知识深度与人格特质。

更新于 2026-01-31北京

大模型金融研究员

校招金融研究类

岗位介绍在金融大模型应用落地的前沿阵地，同花顺已强势布局 100 + 大模型应用场景。在此领域，我们对大模型的通用能力及面向金融应用的专项能力有着极高且特殊的优化需求，涵盖海量数据的实时处理与计算、金融逻辑推理、复杂指令响应、长文本解析、低幻觉控制等多个关键维度。本岗位将立足公司自研大模型与外部开源模型，深度钻研金融场景下模型能力提升的核心技术与创新产品方案，致力于显著增强模型的金融指令跟随能力、降低幻觉率、提升金融数学与逻辑分析水平，全力推动大模型在更多金融场景的成功落地，为用户打造前所未有的投资体验。职责

杭州

策略算法研究员

校招金融研究类

跟踪并深入研究LLM（大语言模型）领域的最新科研成果及业界动态，探索其在金融投资中的应用。参与基于大模型的量化策略设计与算法开发，涵盖信号生成、组合优化、模型训练等环节，利用大模型、多模态技术和强化学习（RL）推进AI投资和AIGC项目。优化大模型在金融场景下的推理效果，结合DPO（决策过程优化）和RLHF（强化学习与人类反馈）提升策略的稳定性与准确性。参与投资Agent系统的开发，全面实现数据获取、分析、决策与执行的自动化链路，提升量化投资决策效率。持续跟踪AI4Finance前沿技术，特别是多模态金融大模型、低延迟推理等领域的最新进展，为量化投资系统提供技术支持。

杭州