logo of sf

顺丰大模型算法高级工程师-(智能体)

社招全职5-10年地点:上海状态:招聘

任职要求


具备大规模语言模型(LLM)或多模态大模型的预训练,指令微调(SFT)或对齐(RLHF)全流程实践经验。

对Transformer架构,缩放定律,大模型训练稳定性有第一手的技术洞察和实操经验。

精通Python,熟练掌握PyTorch框架,具备出色的工程实现与调试能力。

核心技能

扎实的机器学习基础,出色的数据敏感性和分析能力。

熟悉Linux开发环境,具备大规模分布式训练或高性能推理优化经验者…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


基座大模型研发与创新

参与设计并研发面向大规模多元时间序列的预训练基座模型,探索适用于时序数据的
Transformer变体(如Informer,FEDformer, PatchTST)及创新架构。

负责构建超大规模,高质量的时序预训练数据集,设计掩码重建,上下文预测等自监督预训练任务。

研究时间序列中的关键问题,如长周期依赖建模,多尺度特征提取,缺失值处理,以及时序与文本/事件等多模态信息的对齐与融合。

模型深度优化与领域适配

针对特定高价值场景(如电力负荷预测,量化金融,工业设备预测性维护),对基座模型进行深度微调与优化,实现"通用能力"到"领域专家"的转化。

研发高效的模型适配技术(如参数高效微调 PEFT),确保基座模型能够快速,低成本地适配到多样化的下游任务。

系统工程与高性能推理

负责将模型从研究原型推进到稳定,高性能的生产级系统。优化训练框架,利用混合并行(数据并行,模型并行,流水线并行)技术实现千亿参数模型的分布式训练。

主导模型的高效推理优化,应用量化(INT8/ FP4),编译优化等技术,大幅降低服务延迟与资源消耗,支撑海量时序数据的实时预测需求。

技术前瞻与行业赋能

追踪时间序列分析,大模型预训练的前沿学术进展,并将有潜力的技术引入到产品研发中。

与业务团队紧密合作,深入理解行业痛点,将基座模型的强大能力转化为可衡量的业务价值,定义时间序列预测领域的新标准。

岗位要求

必备条件
计算机科学,人工智能,统计学或相关专业硕士及以上学历(博士优先).
包括英文材料
大模型+
SFT+
RLHF+
Transformer+
Python+
PyTorch+
还有更多 •••
相关职位

logo of amap
社招5年以上技术类-开发

● 参与/负责大数据业务的工程研发工作,包括算法工程化、数据加工、服务开发、SaaS 平台建设、解决方案交付等; ● 深度参与技术方案设计和迭代,包括架构升级、性能优化、代码重构、监控体系建设等;

更新于 2025-08-04北京
logo of aliyun
社招5年以上云智能集团

1、深入理解客户业务需求,帮助客户选择适合其业务场景的技术路径和产品组合,利用AI技术知识、架构方法、咨询技能来影响客户技术决策 2、熟悉大模型算法工程化,与客户合作进行模型训练、推理和模型应用等POC,含展示功能、调整模型、优化模型性能、测试分析、Agent搭建、模型调用等内容 3、依据客户需求和技术研判,推动产研部门持续优化产品,助力提升产品竞争力,同时沉淀最佳实践,以及脚本、模板、参考架构等可复用的技术资产 4、持续跟踪行业动态和技术趋势,并与产品团队协作,打造创新的人工智能(大模型、智算、一体机等)解决方案 5、支持市场活动,作为领域专家参与市场洞察、行业标准、市场排名报告、白皮书撰写等活动,并在行业峰会、技术沙龙等市场活动中进行技术传播和分享

更新于 2025-07-27北京
logo of antgroup
社招技术类-算法

1.参与智能投研的技术体系建设与产品化实践,包含股票、权益基金等相关工作; 2.负责股票的因子开发,定量分析建模和交易策略设计等相关工作; 3.结合定量模型和大模型等技术,支持股票,基金等业务场景的智能化内容生产、智能体工具开发和自动/半自动策略构建等相关工作; 4.结合平台用户需求和新技术、探索潜在的新场景。

更新于 2025-06-18上海|杭州
logo of antgroup
社招3年以上技术类-质量保证

1. 按照蚂蚁数科AI产品架构和业务要求,设计AI产品质量保障体系,保障数科AI产品上线质量; 2. 针对AI系统特性进行专项测试方案设计,包含功能/效果的质量保障策略,保障AI系统效果和稳定性; 3. 基于工程和算法团队现有的质效问题给出合理的解决方案,推动项目落地提高交付质量; 4. 通过测试工具、测试技术、测试平台、产品研发测试过程等方面的创新,提升测试效率; 5. 能结合AI行业发展趋势,制定合适的质量技术发展规划,提升团队技术影响力。

更新于 2025-06-30上海|杭州