logo of mi

小米数据集工具链开发工程师

社招全职A159130地点:武汉状态:招聘

任职要求


1. 本科及以上学历,计算机及相关专业
2. 计算机基础扎实,熟悉数据结构算法
3. 熟悉至少一门编程语言,包括但不仅限于 Java、C/C++、Python、Golang
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责自驾数据集平台的设计与开发
2. 负责自驾数据集DataLoader的设计与开发,支撑算法训练提效
3. 负责自驾训练数据湖的设计与开发,支持大规模多模态数据的搜索与管理
包括英文材料
学历+
数据结构+
算法+
Java+
还有更多 •••
相关职位

logo of mihoyo
社招程序&技术类

岗位定位: 致力于将前沿AI技术(LLM、Agents)深度融入游戏工业化管线。通过构建智能数据底座与工具链,打通美术、策划、程序与文档的知识壁垒,提升3A级项目的开发效率。 1. 智能数据底座与知识库构建 - 多模态数据挖掘:负责项目全生命周期资产(美术资源、策划案、代码、技术文档)的深度清洗、自动标注与结构化处理; - 数据预处理:针对各类资产(源码、配置、DCC、uasset、文档等)进行AI预处理分析,提取特征数据,为后续AI模型的训练与推理提供输入; - 知识库架构:搭建并维护基于“关系型数据库 + 向量数据库”的双层架构,构建项目专用知识图谱; - RAG系统开发:实现多维度(关键词+语义理解)混合检索系统,支持代码搜索、资源检索等业务。 2. UE编辑器智能化集成 - UE AI+工具链开发:基于Unreal Engine开发编辑器内的AI辅助工具,将AI能力无缝嵌入开发人员工作流。 3. AI Agent与应用生态 - Agent编排(服务端):基于实际开发场景,设计并编排多Agent协同工作流(Multi-Agent System),部署并维护服务; - 全栈工具开发(客户端):开发独立于引擎的AI生产力工具(形式不限,如Web或App),通过API对接底层模型服务,提供可视化交互界面。 4. 模型部署与调优 (LLM Ops) - 模型落地:负责开源大语言模型的私有化部署、量化与推理加速; - 微调优化:根据项目垂直领域的特定需求,构建数据集并进行模型的SFT或LoRA优化,提升模型在代码生成、剧情润色等场景的表现。

上海
logo of bytedance
社招A70326

1、负责支持3D社交产品游戏引擎工具的技术选型、架构设计、开发维护; 2、为Unity引擎与美术/策划提供无缝衔接,建设整个项目的内容生产管线; 3、持续关注行业动态,设计开发新技术/工具/流程以提升研发效率; 4、负责研发和维护提供给外部用户的美术资产生产的工具集。

更新于 2024-05-21北京
logo of tencent
社招1年以上Aivatar_

1.负责构建面向生成式AI的高质量训练数据集,涉及图像、动画、3D模型等多元美术资产的自动化处理流水线(采集、清洗、修复、增广); 2.主导数据基础平台的建设,设计可扩展的架构以支持多模态数据(如2D/3D资产)的高效管理与协同,确保数据安全、版本控制与跨团队流转效率; 3.研发智能标注工具链,集成主动学习、半自动化标注等技术,降低人工成本,提升数据标注精度与效率。

更新于 2025-12-05深圳
logo of tcl
社招研发技术类

工作职责 1、模型复现与调优: 快速复现RDT-1B(扩散模型)、π0(Flow Matching)、ACT(Transformer)等优秀VLA工作,适配团队数据集与硬件平台。 优化模型推理性能(FP16/INT8量化、TensorRT加速),实现高Hz实时控制。 2、多模态数据采集和后处理: 制定动捕数据采集方案,配合数采团队完成数据后处理。 3、机器人系统集成: 将模型部署至Franka、UR5e等真实机器人,实现抓取、装配、导航等任务。 4、仿真-真实联合训练: 构建高保真仿真环境(Isaac Sim/MuJoCo),支持大规模并行RL训练与Domain Randomization,完成sim2real工作。 开发自动化评测工具,量化模型在真实场景中的成功率与泛化能力。

更新于 2025-03-10深圳