英特尔开源数据标记工具包CVAT

2019年03月06日由 bie管我叫啥发表 383339 0

训练深度神经网络需要大量数据。并且根据现有的AI架构，如果没有标记，那么这些数据就没有多大用处，这需要花费很多时间，特别是处理包含数十万个对象的语料库时。

为了减轻数据注释器和数据科学家的负担，英特尔发布了一个新的开源程序，计算机视觉注释工具（CVAT），旨在加快用于训练计算机视觉算法的视频和图像样本的注释。

“为了加速计算机视觉领域的这一过程，我们开发了一个名为CVAT的程序，”英特尔在一篇博文中写道，“通常，有很多方法可以注释数据，但使用特殊工具可能有助于加快这一过程。”

正如公司所解释的那样，CVAT通过Docker进行部署，并通过基于浏览器的界面（或者可选地嵌入到Onepanel等平台中）进行访问，并具有针对协同工作优化的基于任务的管理系统。它支持与对象检测，图像分类和图像分割有关的监督机器学习任务，以及具有四种形状类型的注释：框，多边形，折线和点。

在CVAT中，注释器可以使用大量工具来复制和传播对象，应用过滤器，调整视觉设置，通过谷歌的TensorFlow框架中的对象检测API执行自动注释等等。CVAT会自动执行一些检查，它可以与英特尔的OpenVino，Nvidia的Cuda和ELK（Elasticsearch，Logstash和Kibana）分析系统等工具包很好地配合使用。

然而，CVAT需要逐渐改进。英特尔表示，它只在Chrome上进行了广泛的测试，并称Chrome的沙盒功能限制了进程周围的环境，包括RAM的使用对工具包的性能产生了负面影响。但是它承诺随着时间的推移会改善。

公司表示，“CVAT是为专业注释和算法团队开发的，并得到了这些团队的支持。我们努力提供这些团队从用户那里获得的最有价值反馈的功能，这将帮助英特尔确定CVAT未来的发展方向。我们希望改进该工具的用户体验、特性集、稳定性、自动化特性以及与其他服务集成的能力，并鼓励社区成员积极参与CVAT的开发。”

开源：

github.com/opencv/cvat

标签：

行业英特尔开源

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇谷歌开源GPipe库，可以有效训练大型深度神经网络

下一篇 AI自动探测停车位，节省时间和资源

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

最好的基于Transformer的LLM（上）