logo of sensetime

商汤26届AI领航员-研究院-大模型算法研究员(金融应用)

校招全职算法研究地点:北京 | 上海状态:招聘

任职要求


1. 硕士及以上学历,计算机、电子信息、软件工程或相关专业,具备NLP/多模态/机器学习相关经验的其他专业背景亦可;
2. 具有较强的研究能力和编码能力,熟练使用深度学习框架(如PyTorchTensorFlow)及常见开源LLM应用框架(如LangChainLlamaIndex、Hugging Face Transformers等);
3. 具备大语言模型(LLM)或Agent开发经验,能够设计和实现智能Agent系统,熟悉Agent的任务分解、工具集成及多模态交互优化;
4. 具有优秀的分析问题和解决问题的能力,能够快速适应复杂金融业务场景的需求;
5. 在国际顶尖期刊或会议(如ACL、EMNLP、NAACL、NeurIPS等)发表过论文,或在知名NLP/LLM相关比赛中取得优异成绩,或具备利用AI加速代码开发的实践经验。

工作职责


1. 负责实现和迭代自然语言处理相关算法,支撑企业数字化业务中的自然语言理解和生成需求,例如信息抽取、文档分析、检索问答、对话交互等;
2. 与工程团队协作,将算法集成到产品中,支撑金融业务场景的迭代优化;
3. 负责某一细分领域的深入算法研究,包括但不限于基础模型开发、对齐研究、推理优化、SFT训练及Agent智能体开发;
4. 设计和开发基于大语言模型(LLM)的智能Agent,优化其在金融场景中的任务规划、工具调用及自主决策能力;
5. 维护相关研究和业务方向的基准(代码、数据、Prompt/Instruction等),将创新算法沉淀为论文、技术报告或专利。
包括英文材料
学历+
NLP+
机器学习+
深度学习+
PyTorch+
TensorFlow+
大模型+
LangChain+
LlamaIndex+
AI agent+
NeurIPS+
相关职位

logo of sensetime
校招算法研究

1. 负责大模型算法框架的研发,整体提升算法框架训练效率,跟进最近的训练技术; 2. 负责探索MOE、RLHF 等相关对齐技术,提升模型的最终效果; 3. 负责多模态模型和Function Call 模型的联合训练,整体优化多模态模型和语言模型联合训练。

更新于 2025-07-28
logo of sensetime
校招算法研究

1. 负责模型压缩算法的研发和实现,包括但不限于模型量化、剪枝、蒸馏等; 2. 负责业务模型在多种场景及对应各异的芯片上的压缩精度提升和保持,包括AIGC(LLM / Stable Diffusion)模型,自动驾驶模型、手机端侧模型等; 3. 负责开发和维护LLM量化部署工具链,调研、复现业界最新的算法,集成工具,并在实际业务中落地, 助力大模型在各个产品线中的应用; 4. 通过分析模型与部署硬件特点,使用软硬结合的优化方案提升模型的速度与精度表现,提升模型压缩能力上限。

更新于 2025-08-21
logo of sensetime
校招算法研究

1.负责开发和研究模型自我优化与进化的算法,通过引入先进的自适应学习技术和进化策略,实现模型在面对新数据时的自动调整和优化; 2.设计和实施自我进化机制,包括但不限于在线学习、持续学习和元学习策略,以提升模型对新环境和新任务的适应性; 3.通过周期性的模型评估和反馈循环,确保模型在实际应用中的性能持续提升,同时解决模型过时的问题; 4.负责大模型训练数据生成及管理,包括合成数据生成和真实数据的收集与清洗; 5.负责建立和维护数据处理流程,以提高数据质量和训练效率; 6.负责开发和优化数据监控系统,进行日志数据的智能分析,及时发现并解决数据处理过程中的问题。 7.与数据科学团队合作,确保模型进化策略与数据获取、处理和分析策略的一致性,从而优化整个模型的学习效率和效果。

更新于 2025-08-04
logo of sensetime
校招算法研究

1.探索大模型后训练的技术边界,持续提升模型的通用人工智能能力; 2.研究强化学习,过程监督等方法在提升模型能力上的最前沿技术; 3.研究长思维链推理中的核心问题,如幻觉抑制,长度压缩等。

更新于 2025-08-21