小米新业务部-AI大模型加速优化算法工程师
任职要求
岗位要求: 1.从事大模型、AIGC、深度学习、AI芯片等两个或以上相关领域工作经验,有2年及以上的工作经验,主导或者作为主要参与者; 2.对AI算法(尤其是大模型、AIGC、AD算法)的量化剪枝、网络结构搜索、稀疏化、性能效果优化和训练调参等有丰富开发调试经…
工作职责
岗位职责: 1.进行大模型、多模态大模型、AIGC模型、自驾模型等多个方向端侧加速优化算法的研发与探索 2.工作内容包括但不限于上述模型的训练调优、量化、剪枝、小型化、稀疏优化、投机推理、专用加速、结构搜索(NAS)等 3.与芯片团队配合针对相关加速特性进行芯片算法联合设计与优化,并提供针对自研芯片的完整算法加速解决方案 4.帮助客户在自研芯片上进行算法加速优化的模型加速优化训练及交付
1、参与多模态大模型的结构设计、预训练任务、模型训练和推理加速等工作,包括但不限于多模态预训练、跨模态检索等; 2、参与多模态大模型的应用构建,结合现有相关业务和开源技术,对多模态大模型的特定能力进行针对性优化; 3、研究未来生活中的端侧创新应用场景,例如个性化的手机助手、个人知识库,探索技术边界; 4、撰写技术报告和论文,积极参与公司内外部的技术交流与合作,推动团队在多模态大模型技术水平和业务落地能力上的提升,增强团队在行业内的影响力和知名度。
语音是人机交互中最自然、最便捷的模态。随着大模型时代的到来,语音 AI 正在从单一的任务处理向多模态、高自然度的“数字员工”演进。 在我们这里,RTC 不仅仅是传输管道,而是数字人的神经中枢。我们已经打通了 WebRTC 全链路,并实现了打断、轮次检测等核心能力。现在的目标是攻克 极致交互延迟、拟人化情感合成、以及具备 RAG 与工具调用能力的语音 Agent。加入我们,你将亲手打造一个“听得清、反应快、有记忆、能办事”的数字灵魂。我们倡导 AI-First 的开发哲学,鼓励利用 AI Coding 与 Vibe Coding 的新范式,快速将创意转化为亿万级用户的交互体验。 【岗位职责】 1. 全链路算法研发与优化: ○ 负责 ASR/LLM/TTS 全链路的协同优化。通过流式算法(Streaming)与端到端优化,挑战 RTC 场景下人机对答的物理延迟极限。 2. 语音 Agent 大脑构建: ○ RAG 与知识增强: 集成检索增强生成(RAG)技术,提升数字人在垂直领域(如医疗预约、智能客服)的专业度。 ○ 实时任务编排: 研发高可靠的 Tool Use(工具调用) 逻辑,使数字人能实时操作后台系统,并处理调用过程中的长延迟等待与交互反馈。 ○ 记忆管理: 建立长短期记忆系统,确保数字人在多轮复杂对话中保持语境一致性。 3. 专项技术突破: ○ 高鲁棒性交互: 研发基于深度学习的智能 VAD 与“语义打断”逻辑,解决强噪声及复杂环境下的起停点识别痛点。 ○ 拟人化表达: 微调 TTS 模型(如情感自适应、口语化重写),提升音色的情感表现力与韵律感。 4. 模型工程化落地: 推动算法在 GPU 环境下的高性能部署,优化并发场景下的状态机管理、显存调度及异常重试机制。 5. 前沿预研: 跟踪并实践 Speech-to-Speech (S2S) 原生端到端交互,探索大模型驱动的语音多模态融合方案;跟踪并实践两段式(ASR+多模态/多模态+TTS)低延迟交互。
我们致力于在电商交易生态中,定义下一代AI驱动的服务范式。你将作为核心成员,负责打造具备高情商、强逻辑、高可靠性的 Service Agent。我们不仅是在做小蜜智能对话机器人,更是通过大模型技术重塑数亿用户的智能服务办理流程,构建电商服务领域的“数字大脑” 1. Agent应用架构设计与落地:负责电商服务领域复杂服务场景(如小蜜、纠纷&赔付、服务风控),设计并搭建具备多步推理、工具调用能力的 Agent 架构,负责核心产品的workflow设计,解决智能服务长链路以及多链路协作难点; 2. 构建高可用智能服务系统:主导Agent算法工程的应用落地,涵盖向量库选型、多路召回策略实现、Context Engineering以及工具调用的精准控制。负责大模型推理加速、响应延迟及成本路由控制。提升复杂商业场景下的问题解决率及落地稳定性; 3. Agent系统效果评测与迭代:针对电商服务中的高置信度场景,构建 Service Agent 专属评估体系(Benchmark)及全链路自动化评测体系,通过数据工程手段优化Prompt工程与知识库质量,确保Agent 输出符合服务严谨性要求; 4. 前沿技术探索与转化:探索多智能体协作(Multi-Agent)、多模态融合和Self-Evolving等前沿方向,鼓励将学术界的最新成果快速转化为可落地的产品能力。

我们致力于在电商交易生态中,定义下一代AI驱动的服务范式。你将作为核心成员,负责打造具备高情商、强逻辑、高可靠性的 Service Agent。我们不仅是在做小蜜智能对话机器人,更是通过大模型技术重塑数亿用户的智能服务办理流程,构建电商服务领域的“数字大脑” 1. Agent应用架构设计与落地:负责电商服务领域复杂服务场景(如小蜜、纠纷&赔付、服务风控),设计并搭建具备多步推理、工具调用能力的 Agent 架构,负责核心产品的workflow设计,解决智能服务长链路以及多链路协作难点; 2. 构建高可用智能服务系统:主导Agent算法工程的应用落地,涵盖向量库选型、多路召回策略实现、Context Engineering以及工具调用的精准控制。负责大模型推理加速、响应延迟及成本路由控制。提升复杂商业场景下的问题解决率及落地稳定性; 3. Agent系统效果评测与迭代:针对电商服务中的高置信度场景,构建 Service Agent 专属评估体系(Benchmark)及全链路自动化评测体系,通过数据工程手段优化Prompt工程与知识库质量,确保Agent 输出符合服务严谨性要求; 4. 前沿技术探索与转化:探索多智能体协作(Multi-Agent)、多模态融合和Self-Evolving等前沿方向,鼓励将学术界的最新成果快速转化为可落地的产品能力。