快手金融大模型算法专家-【电商】(杭州)
社招全职5年以上D13445地点:杭州状态:招聘
任职要求
1、计算机科学、统计学、金融工程等相关专业优先,5 年及以上大规模深度学习或风险模型研发经验; 2、主导过亿级样本、多源异构数据的模型建设,对 Transformer/Hyena/Performer 等长序列架构具备源码级理解; 3、精通多模态对齐、RAG、RLHF 及量化与蒸馏等 LLM 技术,熟练使用 PyTorch 或 JAX 并掌握 DeepSpeed/FSDP 等分布式训练框架; 4、加分项:顶会论文或核心开源项目贡献者、GPU/芯片资源优化经验、在多个国家或地区成功落地信贷模型的经历。
工作职责
【团队与岗位介绍】 1、本岗位将主导 金融行为序列大模型与多模态大语言模型在信贷业务中的应用; 2、 应用场景覆盖贷前、贷中、贷后全流程:包括准入评分、授信定价、欺诈识别、风险预警、智能催收等关键环节。 【岗位职责】 1、设计并实现金融行为序列大模型与多模态 LLM 的整体技术方案,形成可持续迭代的算法资产,在信贷风控业务场景落地; 2、建立统一的数据标准与特征工程体系,确保模型在高噪声、弱标签环境下的稳健性与可解释性。
包括英文材料
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
RAG+
https://www.youtube.com/watch?v=sVcwVQRHIc8
Learn how to implement RAG (Retrieval Augmented Generation) from scratch, straight from a LangChain software engineer.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
DeepSpeed+
https://www.youtube.com/watch?v=pDGI668pNg0
相关职位
社招A175910
团队介绍:IaaS字节跳动基础架构IaaS团队致力于不断创新,推动云计算产业发展和IaaS架构演进。作为云计算基座我们服务了字节跳动旗下包括抖音、今日头条、西瓜视频、飞书等明星产品, 并通过火山引擎云基础产品服务外部客户:包括金融、汽车、游戏、电商、社交媒体、高端制造、科研院所等各行各业的丰富场景, 为亿级用户量的APP和ToB业务提供安全、稳定、高性价比的算力。 我们坚持全栈自研,软硬一体,全面拥抱云原生, 在技术上追求极致: -基于智能库存调度、精细化监控以及自动化运维能力, 来管理遍布全球超百万台规模的服务器集群; -自研高吞吐、低延迟、高弹性的网关网元以及高弹性高并发的计算存储服务来应对抖音春晚、双十一等各种流量洪峰; -打造万卡超大规模的GPU集群, 与机器学习平台、火山方舟一起构建了从基础设施到模型生态的完整解决方案; -此外,还提供和火山引擎公有云同源架构的veStack混合云平台,支撑客户的本地化部署和跨云资源的弹性伸缩等。 1、负责大模型训练和推理所需的IaaS基础设施的规划、建设与维护; 2、与业务团队密切合作,支持业务新算法和模型的集成,并优化其在IaaS基础设施上的性能; 3、开发和维护自动化工具,提高大规模模型基础设施的可观测性、可扩展性和可管理性; 4、跟踪业界AI新兴技术和行业趋势,参与新技术的研究与应用,推动基础设施的持续升级。
更新于 2024-07-09
社招3年以上技术类-数据
1、围绕支付业务目标,通过数据分析洞察、构建分析工具,为业务目标达成提高效率; 2、通过统计建模、因果推断、AB实验设计等数据科学方法,在科学量化运营策略效果和价值的同时,产出业务策略优化建议,助力业务目标达成。 3、前沿技术探索与落地:探索大模型等技术在支付数据场景的应用,推动数据分析和挖掘的效能革新。
更新于 2025-09-12