顺丰大模型算法高级工程师(预测)
任职要求
必备条件 1. 统招硕士及以上学历(博士优先),计算机、人工智能、统计学或相关专业 。 2. 具备5年及以上机器学习/深度学习算法研发经验,其中至少2年专注于预测类模型(如时序预测、需求预测),并有成功的大模型相关项目落地经验 。 3. 精通Python和SQL,熟练使用PyTorch或TensorFlow等主流深度学习框架 。 4. 深入理解常见的预测算法(如ARIMA、XGBoost、LSTM、Transformer等),具备扎实的数理基础 。 具备处理大规模数据集的经验,熟悉Spark、Fl…
工作职责
1. 参与制定团队在预测大模型领域的技术发展路线,负责关键算法的选型、架构设计、性能优化与落地交付,攻克高并发、高精度等技术难点 。 2. 主导高精度预测大模型(如时序预测、多模态预测)的研发全流程,包括模型设计、特征工程、训练调优及评估上线。探索并实践大模型(如Transformer系列)在物流预测场景的微调(Fine-tuning)、提示词工程(Prompt Engineering)以及RAG、智能体(Agent)等高级技术的应用 。 3. 负责或指导模型的部署、推理加速(如使用TensorRT/ONNX)及线上监控,确保算法服务的高可用与低延迟,并持续进行性能调优与轻量化部署 。 4. 紧密跟踪并评估业界SOTA模型与技术趋势,进行技术预研和概念验证(PoC),保持团队算法能力的行业领先性 。 5. 与业务部门、数据工程师、产品经理等紧密协作,深入挖掘需求,将算法成果转化为可落地的解决方案。指导中级工程师,进行知识沉淀与技术分享 。
基座大模型研发与创新 参与设计并研发面向大规模多元时间序列的预训练基座模型,探索适用于时序数据的 Transformer变体(如Informer,FEDformer, PatchTST)及创新架构。 负责构建超大规模,高质量的时序预训练数据集,设计掩码重建,上下文预测等自监督预训练任务。 研究时间序列中的关键问题,如长周期依赖建模,多尺度特征提取,缺失值处理,以及时序与文本/事件等多模态信息的对齐与融合。 模型深度优化与领域适配 针对特定高价值场景(如电力负荷预测,量化金融,工业设备预测性维护),对基座模型进行深度微调与优化,实现"通用能力"到"领域专家"的转化。 研发高效的模型适配技术(如参数高效微调 PEFT),确保基座模型能够快速,低成本地适配到多样化的下游任务。 系统工程与高性能推理 负责将模型从研究原型推进到稳定,高性能的生产级系统。优化训练框架,利用混合并行(数据并行,模型并行,流水线并行)技术实现千亿参数模型的分布式训练。 主导模型的高效推理优化,应用量化(INT8/ FP4),编译优化等技术,大幅降低服务延迟与资源消耗,支撑海量时序数据的实时预测需求。 技术前瞻与行业赋能 追踪时间序列分析,大模型预训练的前沿学术进展,并将有潜力的技术引入到产品研发中。 与业务团队紧密合作,深入理解行业痛点,将基座模型的强大能力转化为可衡量的业务价值,定义时间序列预测领域的新标准。 岗位要求 必备条件 计算机科学,人工智能,统计学或相关专业硕士及以上学历(博士优先).
1.负责1688商家与商品的长周期需求预测,提升商家生意企划与生意解决方案的效果保障 2.负责1688商家经营端商品认知与品类规划垂直大模型,包括市场需求预测、供给需求匹配等,提升商家Agent的决策规划能力 3.负责1688商家全店生意企划与经营Agent开发,提升商家经营体验与效率 4.跟踪业界前沿算法进展,结合1688商家经营的业务场景,探索多模态、MOE和生成式决策等LLM能力的落地应用方案

1、负责金融领域的投资数据挖掘、数学建模及AI模型开发工作,为客户提供智能化数据分析解决方案; 2、基于业务场景设计数据需求,运用大模型等技术进行多维度数据分析与挖掘,构建预测模型; 3、研究和实现前沿的大模型算法,包括但不限于NLP、强化学习等在金融领域的应用; 4、利用深度学习框架开发金融预测模型,优化现有算法,提升模型准确率和运行效率; 5、参与生成式AI模型的训练与优化,探索其在投资决策中的创新应用; 6、 与业务部门紧密合作,将AI技术转化为实际业务价值。