安克创新机器人平台仿真算法工程师(北京)
任职要求
1. 计算机科学、人工智能、自动化、机器人、电子信息等相关专业硕士及以上学历,具备扎实的机器人学理论,计算机视觉知识,了解基本图形学、物理引擎及渲染管线; 2. 熟悉主流3D重建技术,如NeRF/3DGS/SfM/MVS等;熟悉DUSt3R/VGGT等相关算法; 3. 至少熟悉一种机器学习/深度学习框架,如 PyTorch、TensorFlow 等,具备强化学习基础知识; 4. 优秀的…
工作职责
1. 核心算法研发:参与机器人平台视觉与物理仿真系统的算法开发,包括但不限于基于3DGS的三维重建、生成式重建、逆渲染和相关物理仿真算法的设计和实现; 2. 评测与优化:在仿真场景工作流中集成算法成果,对性能和真实度进行评测及优化,实现算法的迭代升级; 3. 实际业务落地:基于Isaac Sim仿真平台开发,实现机器人运动/动力学建模,优化仿真系统性能,参与渲染引擎及其他研发团队密切协作,支持业务落地,解决实际场景的技术问题,共同推进平台能力研发; 4. 前沿技术探索:关注计算机视觉、3D重建、生成式AI及物理世界模型相关领域最新的学术研究成果,并进行调研、验证和应用,推动公司在该领域的技术创新。
职位描述: 1.核心算法研发:参与机器人平台视觉与物理仿真系统的算法开发,包括但不限于基于3DGS的三维重建、生成式重建、逆渲染和相关物理仿真算法的设计和实现; 2.评测与优化:在仿真场景工作流中集成算法成果,对性能和真实度进行评测及优化,实现算法的迭代升级; 3.实际业务落地:基于Isaac Sim仿真平台开发,实现机器人运动/动力学建模,优化仿真系统性能,参与渲染引擎及其他研发团队密切协作,支持业务落地,解决实际场景的技术问题,共同推进平台能力研发; 4.前沿技术探索:关注计算机视觉、3D重建、生成式AI及物理世界模型相关领域最新的学术研究成果,并进行调研、验证和应用,推动公司在该领域的技术创新。
1. 负责 高保真仿真场景重建算法和工具开发; 2. 负责 仿真场景数字孪生建设和仿真场景泛化能力建设; 3. 负责 仿真环境Mesh渲染优化、Mesh自动化补全算法开发; 4. 负责 3D资产/场景自动化导入仿真平台,物理属性自动识别工具开发。 【课题名称】 仿真场景高精细度重建 【课题内容】 针对机器人的操作和导航场景, 开发高保真的仿真场景重建算法和工具链, 具体包含: 1. 仿真场景视觉高保真重建 2. 仿真资产物理属性自动还原 3. 资产自动化导入仿真平台, 自动化补全Mesh 4. 仿真环境Mesh渲染优化
1. 负责研究和开发多模态大模型,包括语言、图像、视频和3D模态的融合,图像生成/增强,视频动作/关系理解等; 2. 进行大模型的分布式训练、调优、验证和部署; 3. 跟踪最新的学术论文和技术发展,积极产出高水平的研究成果。
通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备多模态、多语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从亿级到万亿级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 在此基础上,我们致力于研究Qwen面向具身智能领域的下一代基础模型,将Qwen强大的认知与推理能力赋予物理世界的机器人智能体,打破数字世界与物理世界的壁垒。团队的目标是研发能够理解人类意图、感知物理环境、并自主规划执行复杂任务的通用具身基础模型。我们相信,通过融合前沿的多模态大模型与机器人技术,我们将开创通用人工智能的下一个篇章,让AI真正走进并服务于现实生活。 工作职责: 1. 具身基础模型研究:构建面向机器人的多模态基础模型,将视觉语言模型与机器人中心的物理世界理解与决策深度融合,构建具身领域的高质量的大规模真实与仿真数据集,设计并训练支持感知、动作、记忆、规划与语言理解统一的具身基础模型。 2. 测评基准建立:构建面向机器人多模态基础模型的能力基准,设计有效的测试基准,持续构建能反映基础模型在物理世界真实能力的高效测评系统。 3. 软硬件系统整合部署:构建机器人软硬件一体化系统,将算法部署在真实机器人平台(如机械臂、人形机器人)上,进行端到端的验证与迭代,推动研究成果的实际落地。