logo of tencent

腾讯金融大模型技术专家

社招全职5年以上CDG技术地点:深圳状态:招聘

任职要求


1.计算机科学、人工智能、数学或相关专业博士学历,5年以上NLP/语言大模型研发经验;
2.精通Transformer模型及其变种原理与架构,熟悉预训练、微调、对齐、模型蒸馏、量化等技术,熟悉PPO及GRPO等策略优化算法,具备强化学习训练经验优先;
3.熟练掌握Python,…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责金融领域大语言模型(LLM)的设计、训练、调优与评估,结合金融场景需求进行模型创新,达到金融场景对深度推理、指令跟随等能力的增强要求,打造行业大模型的标杆;
2.持续跟踪AI大模型领域(如openAI、Llama、Deepseek等)与金融科技的前沿进展,探索技术突破方向,指导团队技术发展路径;
3.优化大模型推理效率,解决金融场景中高并发、低延迟、高稳定性的挑战。
包括英文材料
学历+
NLP+
大模型+
Transformer+
算法+
还有更多 •••
相关职位

logo of aliyun
社招3年以上云智能集团

1. 行业解决方案设计与交付 - 基于阿里云大模型技术(如通义千问),为银行、保险、证券等金融客户量身定制AI大模型解决方案,覆盖AI财富助手、智能客服、智能风控等核心场景。 - 深入理解客户业务痛点,提供从需求分析、技术选型到方案落地的全流程支持,确保大模型技术与金融业务深度融合。 2. 大模型全生命周期技术赋能 - 主导客户侧大模型后训练(Post-training)、领域微调(Domain-specific Fine-tuning)、模型蒸馏(Distillation)及多模态融合优化,提升模型在金融垂直场景的精度及性能。 - 优化大模型训练与推理性能,包括分布式训练加速(如DeepSpeed、Megatron-LM)、显存优化、量化压缩(INT8/FP16)及低延迟推理部署(如vLLM、SGLang)等。 3. 工程化落地与性能调优 - 解决金融场景高并发、高稳定性需求,设计高性能计算架构,优化模型在GPU/TPU集群的训练效率及端到端推理链路。 - 结合金融行业数据隐私与安全要求,设计符合监管的模型部署方案。 4. 客户技术赋能与生态共建 - 面向客户技术团队提供大模型技术培训、实战工作坊及POC验证,推动AI能力在客户内部的规模化应用。 - 沉淀金融行业大模型最佳实践,输出白皮书、案例研究及标准化解决方案,提升阿里云在金融AI领域的市场影响力。

更新于 2025-12-09深圳|广州
logo of aliyun
社招3年以上云智能集团

1. 行业解决方案设计与交付 - 基于阿里云大模型技术(如通义千问),为银行、保险、证券等金融客户量身定制AI大模型解决方案,覆盖AI财富助手、智能客服、智能风控等核心场景。 - 深入理解客户业务痛点,提供从需求分析、技术选型到方案落地的全流程支持,确保大模型技术与金融业务深度融合。 2. 大模型全生命周期技术赋能 - 主导客户侧大模型后训练(Post-training)、领域微调(Domain-specific Fine-tuning)、模型蒸馏(Distillation)及多模态融合优化,提升模型在金融垂直场景的精度及性能。 - 优化大模型训练与推理性能,包括分布式训练加速(如DeepSpeed、Megatron-LM)、显存优化、量化压缩(INT8/FP16)及低延迟推理部署(如vLLM、SGLang)等。 3. 工程化落地与性能调优 - 解决金融场景高并发、高稳定性需求,设计高性能计算架构,优化模型在GPU/TPU集群的训练效率及端到端推理链路。 - 结合金融行业数据隐私与安全要求,设计符合监管的模型部署方案。 4. 客户技术赋能与生态共建 - 面向客户技术团队提供大模型技术培训、实战工作坊及POC验证,推动AI能力在客户内部的规模化应用。 - 沉淀金融行业大模型最佳实践,输出白皮书、案例研究及标准化解决方案,提升阿里云在金融AI领域的市场影响力。

更新于 2025-12-23深圳|广州
logo of tencent
社招5年以上腾讯云产品

1.主导金融行业的大模型解决方案设计,输出包含以下要素的完整方案:技术可行性(模型选型/微调策略/合规方案)、成本效益分析(计算/云资源规划); 2.面向金融机构决策层,主持大模型战略级技术宣讲,针对董事会级会议定制技术叙事框架,将模型参数、训练成本等专业概念转化为商业价值语言; 3.解决客户场景中的高阶技术问题; 4.构建我司在金融行业大模型领域的影响力,负责与合作伙伴联合设计行业解决方案白皮书等。

更新于 2025-09-09北京
logo of baidu
社招5年以上ACG

-数据库质量保证策略设计 -基于数据库内核架构(如事务引擎、存储管理、并发控制等),设计覆盖功能、性能、稳定性、安全性和灾难恢复的综合性测试策略 -针对极端场景(如硬件故障、网络分区、超大规模数据压力)和大事务/高并发场景,构建破坏性测试和压力测试模型 -测试用例开发 -编写自动化测试脚本(如Python/Perl/Shell/C++),覆盖SQL语法、事务隔离级别、锁机制、备份恢复等核心功能 -自动化测试工具以及测试用例管理平台的开发和管理工作。 使用各种测试工具和技术,自动化测试,记录和分析测试结果,并跟踪和验证缺陷 -编写测试报告和文档: 清晰准确地记录测试过程、结果和分析,编写测试报告和相关文档 -设计复杂场景测试用例,例如:极端压力测试:模拟百万级并发事务、TB级数据量下的系统稳定性;破坏性测试:强制断电、磁盘I/O错误注入、内存溢出等异常场景;边界条件测试:验证索引深度、页分裂、日志写满等临界值场景 -性能分析与调优 -使用工具(如sysbench、tpcc、tpch、自定义基准测试)分析查询执行计划、锁竞争、I/O瓶颈 -结合内核日志(如InnoDB redo log、PostgreSQL WAL)定位性能问题,推动优化方案落地 -缺陷管理与协作 -搭建测试环境(含多节点集群、混合负载),复现并跟踪内核级Bug(如死锁、数据不一致) -与开发团队紧密合作,提供Root Cause Analysis(RCA)支持,参与代码审查,提供测试反馈,协助开发人员定位和修复问题,推动内核代码修复 -技术预研与创新 -探索新技术(如向量化查询、持久内存、分布式事务)的测试方法 -开发定制化测试工具(如混沌工程平台、自动化故障注入系统)

更新于 2025-04-03北京|上海|深圳