小米顶尖应届-大模型算法工程师(人车协同与风险预测方向)-汽车架构
任职要求
1、计算机科学、人工智能、统计学、交通工程、车辆工程、自动化等相关专业,博士优先; 2、熟悉机器学习、深度学习、时序建模、因果推断、异常检测、多模态融合等方向; 3、熟悉Python、PyTorch、Ten…
工作职责
1、构建驾驶行为特征体系,基于车速、加速度、制动、转向、跟车、道路、环境、DMS和驾驶辅助状态等数据,形成可解释的驾驶行为画像; 2、研究高维车端时序数据表征学习方法,构建面向安全风险预测的时序模型; 3、建立驾驶行为与安全事件、能耗表现、整车健康状态之间的关联分析与因果推断框架; 4、研究人工驾驶、辅助驾驶、接管切换等人机协同场景下的风险识别模型; 5、推动模型在安全画像、安全分、风险预警、事故分析、健康管理等业务中的工程化落地; 6、沉淀可复用算法组件、技术文档、论文与专利。
1. 负责各类多模态大模型的预训练,微调和部署,并应用于实际业务中; 2. 探索知识增强技术,通过个人数据提升个性化模型的语言理解和生成能力; 3. 融合多模态数据,攻关具备自主观察环境和推断用户需求的意图决策大模型; 4. 搭建基于端侧VLM的屏幕理解能力,实现具备泛场景能力的GUI Agent; 5. 探索机器学习领域的新技术,探索与其他领域的技术融合。并撰写相关论文,专利。 【课题名称】 OSAgent能力预研:记忆、决策与操控 【课题内容】 1. 记忆:端侧持续进化的数字人格; 2. 决策:精准意图预测的主动智能; 3. 操控:人车家全生态的泛在操控。
1. 构建行业有影响力的各类智能体和研究对应学术前沿问题,训练业界效果领先的大模型智能体模型,并通过发表论文、开源、竞赛等,打造学术影响力; 2. 打造业界一流的通用大模型智能体解决方案,并落地小米核心业务。 【课题名称】 大模型智能体研究与应用 【课题内容】 构建行业有影响力的各类智能体和研究对应学术前沿问题,包括但不限于: 1. 研究通用任务AI Agent核心技术,包括但不限于规划、工具调用、多智能体等,并构建和开源业界有影响力的AI Agent模型和解决方案; 2. 研究GUI Agent相关核心技术,包括但不限于SFT、离线强化学习、在线强化学习等,并训练和开源业界有影响力的GUI Agent模型; 3. 研究强化学习算法全流程核心技术,包括但不限于算法优化,奖励函数设计、环境构建等,并基于强化学习构建和开源业界有影响力的推理大语言模型、GUI Agent模型、deep search模型等; 4. 研究RAGRAG全流程核心技术,包括但不限于音-视-文全模态理解与生成、端侧RAG等,并推动相关领域技术突破和业务落地。
1. 参与领域大模型相关技术的调研验证; 2. 参与手机相机影像相关算法研发工作,开发行业领先的影像大模型算法; 3. 参与手机相机视觉相关功能研发,交付落地旗舰机; 4. 研究行业动态,紧跟视觉/多模态大模型相关领域最新学术研究成果并转化成商用技术; 5. 参与学术研究,产出具备行业影响力的科研成果。 【课题名称】 影像大模型研发 【课题内容】 1. 影像领域基础模型的研发; 2. 基于大模型的端到端影像系统研发; 3. 基于大模型影像功能算法的研发; 4. 基于大模型的图像理解、感知算法的研发; 5. 大模型小型化技术探索及研发。