CapeAnalytics:通过图像处理实现道路自动检测
2019年05月03日 由 文灬森特 发表
276844
0
2018年,我们的一名团队成员分享了 “经济学人” 的新闻文章,内容涉及最近爆发的埃博拉疫情以及为刚果民主共和国绘制道路和建筑物的地图的紧急努力:
“5月9日,在Bikoro确认第一批埃博拉病例后的第二天,一项国际慈善机构无国界医生组织(MSF)[无国界医生]总部提出了一项紧急请求。必须提供刚果民主共和国这一部分的地图,以提供疫苗和医疗帮助。然而,准确的并不存在。
无国界医生向人群寻求帮助。通过在线教程培训的志愿者开始分析卫星图片和绘图地图。大约450名志愿者已经设法在疫情爆发地区设置了大约67,000个建筑物和1000公里的道路,完成了几天可能需要几个月的任务。其中一些新地图已经在现场。“
在几天内绘制1000公里的道路并非易事。但是,在计算机视觉和航空影像分析领域也许可以实现自动化,也许它可以在几小时或几分钟内完成。如果是这样,它可以为像医生无国界组织这样的团体带来许多好处。
这次讨论使我们进入了Cape Analytics的第一个项目,我们决定探索从航空影像中识别道路的方法。作为该项目的一部分,我们最感兴趣的是看模型是否能成功提取道路网络,估算道路宽度,并评估道路表面类型(例如告诉泥土和沥青之间的区别)。
作为一家专注于房地产分析的公司,道路固有的其他一些技术挑战。从架空的角度来看,建筑物是2D对象,可以表示为简单,紧凑的多边形。然而,道路并不那么简单。您如何确定复杂道路网络中多种拓扑结构的多边形以及车道,平分天桥和人行道等具有挑战性的特征?而且,你如何分解和处理大片区域?一个道路网络在哪里结束在哪里开始?
要回答这些问题,我们必须开始工作。
我们的方法
分类学发展
关键的第一步是开发明确的道路存在和路面分类。对于道路,我们定义了两个标签:道路或背景。对于路面,我们定义了五个标签:混凝土,沥青,泥土,未知和背景。我们为基础真实生成众包语义标签活动,然后在内部训练和评估我们的模型。
下面是一个RGB参考(lest)与人类注释的groundtruth掩码(右)的示例
模型开发
然后,我们开发了用于像素级道路分割(2级)和表面估计(5级)模型的多级完全卷积网络(FCN)。我们决定为这个项目推进FCN,因为它们非常适合图像分割并允许任意大小的输入图像。
为了提取道路网络,将这些FCN应用于空中RGB图像,以生成像素级道路可能性的热图。从那里,我们创建了道路二进制掩码。我们通过识别含有掩模的Voronoi单元边缘来提取道路中心线,这些边缘的种子沿着道路掩模的边缘以3米的间隔进行采样[ ref Ojaswa Sharma ]。我们发现Voronoi Diagrams是一种优于Thinning或Distance Maps的方法,因为它们最成功地保留了几何属性和拓扑属性。从图表中,道路网络以图形的形式提取,其沿着道路中心线承载道路宽度和路面类型。
这是输入RGB图像(左),道路热图(中心),最后是道路遮罩(右):
从Voronoi图派生的道路网络示例:
最后,下图显示了与地面实况(右)相比,产生准确结果的5级路面类型模型(左)。
总的来说,我们发现这种方法保留了道路掩模所需的几何和拓扑特性,并提供了精确度和提取速度之间的可调整折衷。目前正在开发一种网络合并方法,以允许模型在大区域内扩展。
性能
我们的2级道路提取像素模型实现了.73的平均Jaccard相似指数(JSI),而我们的5级路面类型模型实现了混凝土,沥青和.47,.65和.41的平均JSI。污垢,分别。目前,在2018年6月的最新计算机视觉和模式识别(CVPR)会议上,提出了一流的道路提取方法,用于称为“DeepGlobe:通过卫星图像解析地球”的会议挑战。团队实现了0.64的JSI。尽管在CVPR挑战中道路是从卫星而不是航空图像中提取的,但我们的结果很可能与最先进的技术一致或更好。
我们面临的一些挑战
当然,该模型在某些情况下也有问题:
- 树木遮挡:一旦树木越来越覆盖道路,模型倾向于将这些像素分类为背景。然而,该模型还学会了“想象”在树木仅部分遮挡道路的情况下的基础道路。
- 具有相似外观的前景和背景:该模型难以区分道路和停车场。假设是训练数据集中的样本显示具有停车场的道路,因此模型试图最佳地猜测道路的位置。在这种情况下,我们发现该模型非常接近地再现了人类贴标机的行为。
- 土路:土路的外观差异较大,模型往往会过度分割土路区域,特别是在图像数据模糊不清的情况下。土路的另一个问题是土路上的家庭车道很难与实际公路区分开来。
为了将该项目与无国界医生志愿者所做的工作联系起来,树木遮挡和泥路将在像刚果民主共和国这样的环境中构成重大挑战。但是,经过进一步改进,我们相信这些可以克服。
潜在用例和后续步骤
尽管仍有许多工作要做,但这个早期的例子用于显示自动道路检测的可行性和初始准确性。许多组织需要更好的道路访问信息,并且大多数组织依靠目击者帐户和志愿者来解析航空图像和注释地图。自动化该过程的一部分对于帮助操作和第一响应者非常有用,特别是在灾难后的情况下。例如,下面是世界粮食计划署的地图,详细描述了尼泊尔的道路通道,2015年地震期间许多道路受损:
通过绘制世界未映射的道路,援助组织可以简化操作 - 准确了解道路的存在位置,当前状况和可通行性,以及它们的构成。所有这一切都可以更有效地监测冲突或向偏远地区部署食物,水和药物等资源,甚至可以提供更详细的信息,如旅行速度(土路比沥青慢得多)。
从这一点来看,为了使自动化解决方案完全可操作,有必要开发可在各种区域和条件下扩展的模型。需要开发大量的实际工作来涵盖角落案件,这当然需要提前进行体力劳动。但是,一旦完成,道路检测过程可以实现自动化,并在数小时内完成。