
商汤研究院-NLP算法研究员(代码助手、拟人对话)
社招全职2年以上算法研究状态:招聘
任职要求
1. 计算机、应用数学、模式识别、人工智能等专业,2 年及以上NLP大语言模型算法开发经验; 2. 熟悉NLP领域,包括但不限于理解、解析及生成人类语言的算法和模型。 3. 具有良好的机器学习和深度学习基础,能够通过从大量的数据中学习来改进理解和回答问题的能力。 4. 良好的团队协作精神和沟通能力,能够与其他团队成员紧密合作。 加分项: 1. 在国际顶尖会议或期刊上发表过论文,如ACL、EMNLP、ICLR、NeurIPS、ICML等; 2. 代码力强劲。如获得过ICPC区域赛金牌、NOI金牌,或有较大影响力的开源项目。
工作职责
1. 负责研究并实现创新算法以解决业务上遇到的NLP问题,支持AI代码助手、虚拟主播语言模型项目,完成对话系统项目中的功能开发; 2. NLP预训练模型:挑战人类能力。探索模型的语义理解与文本生成能力的极限,进行超大模型结构设计,提出更强更通用的NLP预训练模型,对标GPT4; 3. 数理多模态模型:改进多模态特征的融合方式,提出更有效的数理多模态预训练任务; 4. 从系统应用的角度,利用自然语言处理的理论和方法来解决实际业务问题。
包括英文材料
相关职位

校招算法研究
1. 负责大模型算法框架的研发,整体提升算法框架训练效率,跟进最近的训练技术; 2. 负责探索MOE、RLHF 等相关对齐技术,提升模型的最终效果; 3. 负责多模态模型和Function Call 模型的联合训练,整体优化多模态模型和语言模型联合训练。
更新于 2025-07-28

校招算法研究
1. 负责实现和迭代自然语言处理相关算法,支撑企业数字化业务中的自然语言理解和生成需求,例如信息抽取、文档分析、检索问答、对话交互等; 2. 与工程团队协作,将算法集成到产品中,支撑金融业务场景的迭代优化; 3. 负责某一细分领域的深入算法研究,包括但不限于基础模型开发、对齐研究、推理优化、SFT训练及Agent智能体开发; 4. 设计和开发基于大语言模型(LLM)的智能Agent,优化其在金融场景中的任务规划、工具调用及自主决策能力; 5. 维护相关研究和业务方向的基准(代码、数据、Prompt/Instruction等),将创新算法沉淀为论文、技术报告或专利。
更新于 2025-08-21

校招算法研究类
前沿追踪与洞察: 紧跟NeurIPS, ICML, ICLR, CVPR等顶会的最新研究,快速消化、复现并提出独到的见解。 思想的碰撞与具象化: 参与团队Brainstorming,大胆提出你关于下一代模型架构的创新想法,并与团队成员一起论证其可行性。 核心代码实现: 使用PyTorch等框架,设计并实现新颖的多模态模型模块或完整的模型结构。你的代码将是验证想法的核心。 科学的实验与分析: 设计严谨的实验方案,在海量数据和计算资源上进行模型训练与评测,通过数据分析驱动模型迭代优化。 知识沉淀与分享: 撰写技术报告或论文,与团队分享你的发现,共同推动项目前进。
更新于 2025-08-20