理想汽车基座模型-大模型算法工程师-智能体算法-北京
任职要求
1. 博士学历,人工智能、机器学习、计算机科学、模式识别、自然语言处理相关专业 2. 熟悉模型后训练技术,如监督微调(SFT)、DPO、人类反馈强化学…
工作职责
1. 负责记忆智能体算法研发创新及落地,基于世界模型+强化学习技术,实现从专家经验到Agent端到端自主学习的技术演
基座大模型研发与创新 参与设计并研发面向大规模多元时间序列的预训练基座模型,探索适用于时序数据的 Transformer变体(如Informer,FEDformer, PatchTST)及创新架构。 负责构建超大规模,高质量的时序预训练数据集,设计掩码重建,上下文预测等自监督预训练任务。 研究时间序列中的关键问题,如长周期依赖建模,多尺度特征提取,缺失值处理,以及时序与文本/事件等多模态信息的对齐与融合。 模型深度优化与领域适配 针对特定高价值场景(如电力负荷预测,量化金融,工业设备预测性维护),对基座模型进行深度微调与优化,实现"通用能力"到"领域专家"的转化。 研发高效的模型适配技术(如参数高效微调 PEFT),确保基座模型能够快速,低成本地适配到多样化的下游任务。 系统工程与高性能推理 负责将模型从研究原型推进到稳定,高性能的生产级系统。优化训练框架,利用混合并行(数据并行,模型并行,流水线并行)技术实现千亿参数模型的分布式训练。 主导模型的高效推理优化,应用量化(INT8/ FP4),编译优化等技术,大幅降低服务延迟与资源消耗,支撑海量时序数据的实时预测需求。 技术前瞻与行业赋能 追踪时间序列分析,大模型预训练的前沿学术进展,并将有潜力的技术引入到产品研发中。 与业务团队紧密合作,深入理解行业痛点,将基座模型的强大能力转化为可衡量的业务价值,定义时间序列预测领域的新标准。 岗位要求 必备条件 计算机科学,人工智能,统计学或相关专业硕士及以上学历(博士优先).
1.负责VLA基座大模型的架构设计与优化,包括但不限于MoE、MoD、稀疏注意力机制、快慢双系统以及多模态架构设计等 2. 负责VLA训练范式探索,包括但不限于预训练、RL等 3. 负责VLA基座大模型的Scaling Law建设 4. 负责MindVLA后训练算法研究和落地,研究面向L3 Agent的后训练范式,包括监督微调、通用强化学习、智能体强化学习等技术; 5. 参与下一代VLA基座模型的探索与创新研究,打造技术影响力。