小米大数据研发工程师-2027届
任职要求
1、扎实的C++或Python语言知识及熟练运用,扎实的数据结构与算法知识; 2、计算机、数学、机器学习、机器人、自动驾驶或相关专业优先; 3、有较强的独立解决问题能力,学习能力…
工作职责
1、参与实现自动驾驶的数据闭环系统,利用大模型提升各个环节的效率 2、设计优化 PB 级大数据管道,并探索基于 agent/skill/MCP 的智能数据运维与调度
1、负责OTT大屏各链路的质量保障工作 2、负责通过流程优化、持续集成、技术创新等手段持续提升整个研发过程的质量和效率 3、负责测试专项能力建设,不断提升测试团队的专业度和深入度
1、负责利用自然语言处理和机器学习算法,实现客服、销售、收派、运营、办公职能等业务板块大模型的应用落地,支持业务目标的提升; 2、负责大模型的继续预训练、SFT、 RLHF与推理等工作,能够根据场景需求设计高效的训练方案,并解决训练中出现的问题,如过拟合、知识遗忘、上下文漂移等; 3、紧跟大模型技术的最新进展,面向集团各类业务场景,沉淀共性能力,实现大模型技术的标准化与产品化。
1、深入理解业务、产品的方向和需求,构建公司数据分析与数据挖掘体系,针对复杂的业务问题,规划、设计、实现基于数据挖掘的解决方案,充分实现数据的价值; 2、分析和研究数据与实际业务的关联关系,利用数据挖掘的先进技术,针对具体业务需求场景,进行建模分析; 3、基于海量用户行为数据和其他数据,开发设计面向常规算法不能解决问题的可扩展机器学习算法,并以实际业务应用为导向研发创新方法,产生创新应用; 4、为产品运营提供数据分析支持,包括网站数据分析、产品用户分析、行业分析等。
团队介绍: 团队聚焦大模型数据优化、模型调优、多智能体协同、LLM跨领域交叉等关键技术方向,诚邀具备扎实科研能力与工程素养的候选人加入,共同推进人工智能前沿技术的突破与应用。 岗位职责: 1. Agentic前沿研究探索和企业级系统架构: (1) 探索agent自我迭代学习范式,如数据合成、奖励建模、强化微调等,持续改善agent训练效率与效果。 (2) 构建高可用多智能体开发框架,探索多智能体交互新范式。 (3) 探索Human-in-the-loop的交互范式和反馈机制,实现Human和Agent之间的有效任务协作。 (4) Agent Runtime系统建设,助力Agent应用从POC阶段走向生产阶段。 (5) 参与垂直领域Agent应用研发和探索,打造行业垂类应用标杆。 2. 数据与模型协同优化: (1) 探索训练数据处理和优化方法,优化数据菜谱,进而提升模型效果。 (2) 探索结构化数据(SQL)与非结构化数据(如文本、图像、音频等)在应用场景下的有效处理、融合和使用。 3. 开源项目的技术研发与社区共建,推动研究成果开源社区的推广。