顺丰大模型算法高级工程师-(智能体)
社招全职5-10年地点:上海状态:招聘
任职要求
具备大规模语言模型(LLM)或多模态大模型的预训练,指令微调(SFT)或对齐(RLHF)全流程实践经验。 对Transformer架构,缩放定律,大模型训练稳定性有第一手的技术洞察和实操经验。 精通Python,熟练掌握PyTorch框架,具备出色的工程实现与调试能力。 核心技能 扎实的机器学习基础,出色的数据敏感性和分析能力。 熟悉Linux开发环境,具备大规模分布式训练或高性能推理优化经验者…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
基座大模型研发与创新 参与设计并研发面向大规模多元时间序列的预训练基座模型,探索适用于时序数据的 Transformer变体(如Informer,FEDformer, PatchTST)及创新架构。 负责构建超大规模,高质量的时序预训练数据集,设计掩码重建,上下文预测等自监督预训练任务。 研究时间序列中的关键问题,如长周期依赖建模,多尺度特征提取,缺失值处理,以及时序与文本/事件等多模态信息的对齐与融合。 模型深度优化与领域适配 针对特定高价值场景(如电力负荷预测,量化金融,工业设备预测性维护),对基座模型进行深度微调与优化,实现"通用能力"到"领域专家"的转化。 研发高效的模型适配技术(如参数高效微调 PEFT),确保基座模型能够快速,低成本地适配到多样化的下游任务。 系统工程与高性能推理 负责将模型从研究原型推进到稳定,高性能的生产级系统。优化训练框架,利用混合并行(数据并行,模型并行,流水线并行)技术实现千亿参数模型的分布式训练。 主导模型的高效推理优化,应用量化(INT8/ FP4),编译优化等技术,大幅降低服务延迟与资源消耗,支撑海量时序数据的实时预测需求。 技术前瞻与行业赋能 追踪时间序列分析,大模型预训练的前沿学术进展,并将有潜力的技术引入到产品研发中。 与业务团队紧密合作,深入理解行业痛点,将基座模型的强大能力转化为可衡量的业务价值,定义时间序列预测领域的新标准。 岗位要求 必备条件 计算机科学,人工智能,统计学或相关专业硕士及以上学历(博士优先).
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
SFT+
https://cameronrwolfe.substack.com/p/understanding-and-using-supervised
Understanding how SFT works from the idea to a working implementation...
RLHF+
[英文] What is RLHF?
https://aws.amazon.com/what-is/reinforcement-learning-from-human-feedback/
Reinforcement learning from human feedback (RLHF) is a machine learning (ML) technique that uses human feedback to optimize ML models to self-learn more efficiently.
https://www.ibm.com/think/topics/rlhf
Reinforcement learning from human feedback (RLHF) is a machine learning technique in which a “reward model” is trained with direct human feedback, then used to optimize the performance of an artificial intelligence agent through reinforcement learning.
Transformer+
https://huggingface.co/learn/llm-course/en/chapter1/4
Breaking down how Large Language Models work, visualizing how data flows through.
https://poloclub.github.io/transformer-explainer/
An interactive visualization tool showing you how transformer models work in large language models (LLM) like GPT.
https://www.youtube.com/watch?v=wjZofJX0v4M
Breaking down how Large Language Models work, visualizing how data flows through.
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
还有更多 •••
相关职位
社招5年以上技术类-开发
● 参与/负责大数据业务的工程研发工作,包括算法工程化、数据加工、服务开发、SaaS 平台建设、解决方案交付等; ● 深度参与技术方案设计和迭代,包括架构升级、性能优化、代码重构、监控体系建设等;
更新于 2025-08-04北京
社招5年以上云智能集团
1、深入理解客户业务需求,帮助客户选择适合其业务场景的技术路径和产品组合,利用AI技术知识、架构方法、咨询技能来影响客户技术决策 2、熟悉大模型算法工程化,与客户合作进行模型训练、推理和模型应用等POC,含展示功能、调整模型、优化模型性能、测试分析、Agent搭建、模型调用等内容 3、依据客户需求和技术研判,推动产研部门持续优化产品,助力提升产品竞争力,同时沉淀最佳实践,以及脚本、模板、参考架构等可复用的技术资产 4、持续跟踪行业动态和技术趋势,并与产品团队协作,打造创新的人工智能(大模型、智算、一体机等)解决方案 5、支持市场活动,作为领域专家参与市场洞察、行业标准、市场排名报告、白皮书撰写等活动,并在行业峰会、技术沙龙等市场活动中进行技术传播和分享
更新于 2025-07-27北京
社招技术类-算法
1.参与智能投研的技术体系建设与产品化实践,包含股票、权益基金等相关工作; 2.负责股票的因子开发,定量分析建模和交易策略设计等相关工作; 3.结合定量模型和大模型等技术,支持股票,基金等业务场景的智能化内容生产、智能体工具开发和自动/半自动策略构建等相关工作; 4.结合平台用户需求和新技术、探索潜在的新场景。
更新于 2025-06-18上海|杭州