机器学习为CAD插上一双翅膀(上)
2019年07月20日 由 sunlei 发表
324015
0
基于机器学习在无数行业中得到了充分利用,从网络上的提示性搜索到照片库存图像推荐。其核心是,推荐引擎可以在大量数据库中查询相关信息(文本、图像等),并在用户与给定界面交互时将其显示给用户。随着大型3D数据仓库的聚合,架构和设计可以从类似的实践中受益。
事实上,我们学科的设计过程主要是通过3D软件(Rhinoceros 3D, Maya, 3DSmax, AutoCAD)来完成的。无论是通过CAD软件(计算机辅助设计),还是现在的BIM引擎(建筑信息建模),建筑师不断地将他们的意图转化为三维空间中的线条和表面。建议从外部数据源获取相关的3D对象,可能是增强其设计过程的一种方法。
这就是本文的目标:通过“暗示建模”,研究并提出一种帮助设计师的方法。随着建筑师在三维空间的绘制,一系列基于机器学习的分类器将能够搜索相关的建议,并提出替代、相似或互补的设计选项。
为此,我们从三维形状识别和分类领域的先例中汲取灵感,提出了一种方法和工具集,能够在设计师绘制模型时向他们提供建议。事实上,我们的目标是双重的:(1)通过预先建模的建议加速三维建模过程,同时(2)通过替代或互补的设计选项激励设计师。
卷积神经网络
[caption id="attachment_42173" align="aligncenter" width="740"]
卷积神经网络架构[/caption]
能够查询与用户绘制的设计特征匹配的三维对象依赖于特征比较。除了标准的几何描述指标,卷积神经网络(CNNs)提供了一个更简单和更全面的选择来比较形状。
CNNs不匹配简单的指标(也称为特征提取),而是将图像作为输入,将像素表示传递给一系列的“神经元”层(图2)。通过连续的训练和验证阶段,我们能够估计模型的精度,并进一步调整权重以最大限度地提高精度。一旦完全训练,CNN模型将预测给定对象图像表示的“类”或类别。
这种类型的网络是机器学习的标准实践,本身并不代表突破或复杂的体系结构。然而,它仅基于空间特征构建某种程度的直觉的能力与我们的应用程序非常相关:公开可用的3D对象的格式异构性使得特征提取和元数据比较成为一个具有挑战性的过程。能够简单地从对象的拓扑特征来考虑对象,使用图像,为我们提供了一个强大的统一的3D形状比较和检索框架。
一、 先例
我们的工作建立在3个主要研究项目的基础上,这些项目最近构建了三维对象识别和分类领域。这些论文揭示了卷积作为理解和描述三维形状的理想工具的相关性。
[1]用于三维形状识别的多视图卷积神经网络
这篇第一篇论文[1]展示了一个标准的CNN架构,该架构经过训练,可以独立地识别形状呈现的视图,并且表明即使从一个视图中也可以识别三维形状,其精度远远高于使用最先进的三维形状描述符。当提供形状的多个视图时,识别率进一步提高。
[caption id="attachment_42174" align="aligncenter" width="1320"]
多视图CNN用于三维形状识别[/caption]
此外,本文还介绍了一种新颖的CNN体系结构,它将三维形状的多个视图中的信息组合成一个单一且紧凑的形状描述符,从而提供更好的识别性能。
[2] VoxNet:一种用于实时目标识别的三维卷积神经网络
[caption id="attachment_42176" align="aligncenter" width="660"]
VoxNet架构[/caption]
由于激光雷达和RGBD扫描器的可用性越来越高,为了利用日益增长的点云数据库,本文[2]提出了一种“VoxNet”。该模型的结构旨在解决海量点云处理和标记问题,通过将体积占用网格表示与监督的三维卷积神经网络(3D CNN)集成在一起。
使用激光雷达、RGBD和CAD数据对公开可用的基准进行评估。VoxNet在每秒标记数百个实例的同时,最终实现了超出当前技术水平的准确性。
[3]设计中的体积表示和机器学习
最后一篇论文[3]探讨了利用机器学习进行体素建模的机会。
[caption id="attachment_42177" align="aligncenter" width="1464"]
工作流程总结[/caption]
首先介绍了体素建模的概念,并与传统的模型技术进行了比较。阐述了像素映射和图形表示等概念,最终研究了基于机器学习的空间和几何光栅化过程的设计系统或工作流的原型实现。
在这篇文章的上半部分,我想让你们了解卷积作为理解和描述三维形状的理想工具的相关性。明天的内容会更加精彩。