威海景点排行榜:【翻译】OpenVINO Pre-Trained 预训练模子先容

admin 2个月前 (07-31) 科技 38 1

OpenVINO 系列软件包预训练模子先容

本文翻译自 Intel OpenVINO&NBsp;的  "Overview of OpenVINO Toolkit Pre-TRained Models"

原文链接: https://docs.openvinotoolkit.org/latest/_models_intel_index.html

翻译:coneypo,working in Intel for IoT,有问题或者建议迎接留言交流

 

Q&A

问:用 Pre-trained model 可以干什么?

答:我们可以用 Pre-trained 的模子直接输入数据举行 model inference / 推理,而不需要网络数据集自己 Train 一个 model,这些训练好的模子拿来即用,适合新手学习;

 

问:若何使用 OpenVINO 预训练模子举行推算?

答:

1. 先下载安装 OpenVINO 环境: https://docs.openvinotoolkit.org/cn/index.html;

2. OpenVINO 提供的 model zoo 的示例代码在这个 repo :

$ git clone https://github.com/opencv/open_model_zoo

$ cd /open_model_zoo/demos/python_demos/

3. 好比有一个 face_recognition_demo/ 文件夹,内里有个 README.md 告诉怎么设置参数:

python ./face_recognition_demo.py ^
-m_fd <path_to_model>/face-detection-retail-0004.xml ^
-m_lm <path_to_model>/landmarks-regression-retail-0009.xml ^
-m_reid <path_to_model>/face-reidentification-retail-0095.xml ^
--verbose ^
-fg "C:/face_gallery"

4. 下载模子

$ cd /<OPENVINO_INSTALL_DIR>/deployment_tools/open_model_zoo/tools/downloader/

$ sudo ./downloader.py --name face-detection-retail-0004

$ sudo ./downloader.py --name landmarks-regression-retail-0009.xml

$ sudo ./downloader.py --name face-reidentification-retail-0095.xml

5. 运行 face_recognition_demo.py

 

这篇文章中会先容如下模子:

  • Object Detection Models / 目的检测模子
  • Object Recognition Models / 目的识别模子
  • Reidentification Models / 回归模子
  • Semantic Segmentation Models / 语义支解模子
  • Instance Segmentation Models / 实例支解模子
  • Human Pose Estimation Models / 人类姿势识别模子
  • Image Processing/ 图像处置
  • Text Detection / 文本检测
  • Text Recognition / 文本识别
  • Text Spotting / 文本识别
  • Action Recognition Models / 动作识别模子
  • Image Retrieval / 图像检索
  • Compressed models / 压缩模子

 

OpenVINO 软件包提供一系列预训练模子,你可以用来举行学习,或者举行参考设计

OpenVINO 的版本会在 Github_open_model zoo 上面举行维护;

这些模子也可以通过模子下载器 (<OPENVINO_INSTALL_DIR>/deployment_tools/open_model_zoo/tools/downloader) 下载,或者在 01.org 举行手动下载;

 

 

*(弥补)Classification / 分类Detection / 检测Semantic Segmentation / 语义支解Instance Segmentation / 实例支解 区别

 

Object Detection Models / 目的检测模子

OpenVINO 提供一系列热门目的,如人脸/人/汽车等等的检测模子;大多数网络都是基于 SSD (Single Shot MultiBox Detector),而且准确度和性能都不错;

针对于检测相同类型目的的网络(好比 face-detection-adas-0001 和 face-detection-retail-0004),能够以较小的性能价值,让我们到达更高的精度和更广的适用范围;

因此你可以期待一个更大的神经网络,来更好的检测相同类型的工具;

模子名称 庞大度 (GFLOPS) 巨细(MP) 人脸 汽车 自行车 车牌 产物
faster-rcnn-resnet101-coco-sparse-60-0001 364.21 52.79   X X X    
face-detection-adas-0001 2.835 1.053 X          
face-detection-adas-binary-0001 0.819 1.053 X          
face-detection-retail-0004 1.067 0.588 X          
face-detection-retail-0005 0.982 1.021 X          
face-detection-0100 0.785 1.828 X          
face-detection-0102 1.767 1.842 X          
face-detection-0104 2.405 1.851 X          
face-detection-0105 2.853 2.392 X          
face-detection-0106 339.597 69.920 X          
person-detection-retail-0002 12.427 3.244   X        
person-detection-retail-0013 2.300 0.723   X        
person-detection-action-recognition-0005 7.140 1.951   X        
person-detection-action-recognition-0006 8.225 2.001   X        
person-detection-action-recognition-teacher-0002 7.140 1.951   X        
person-detection-raisinghand-recognition-0001 7.138 1.951   X        
pedestrian-detection-adas-0002 2.836 1.165   X        
pedestrian-detection-adas-binary-0001 0.945 1.165   X        
pedestrian-and-vehicle-detector-adas-0001 3.974 1.650   X X      
vehicle-detection-adas-0002 2.798 1.079     X      
vehicle-detection-adas-binary-0001 0.942 1.079     X      
person-vehicle-bike-detection-crossroad-0078 3.964 1.178   X X X    
person-vehicle-bike-detection-crossroad-1016 3.560 2.887   X X X    
vehicle-license-plate-detection-barrier-0106 0.349 0.634     X   X  
product-detection-0001 3.598 3.212           X
person-detection-asl-0001 0.986 1.338   X        
yolo-v2-ava-0001 29.38 48.29   X X X    
yolo-v2-ava-sparse-35-0001 29.38 48.29   X X X    
yolo-v2-ava-sparse-70-0001 29.38 48.29   X X X    
yolo-v2-tiny-ava-0001 6.975 15.12   X X X    
yolo-v2-tiny-ava-sparse-30-0001 6.975 15.12   X X X    
yolo-v2-tiny-ava-sparse-60-0001 6.975 15.12   X X    

 

Object Recognition Models / 目的识别模子

目的识别模子用来举行 Classification / 分类Regression / 回归Charcter recognition / 特征识别

针对某种特征举行检测之后,再使用这些神经网络举行检测/识别(好比在人脸识别之后,再举行岁数/性别的识别);

模子名称 庞大度 (GFLOPS) 巨细 (MP)
age-gender-recognition-retail-0013 0.094 2.138
head-pose-estimation-adas-0001 0.105 1.911
license-plate-recognition-barrier-0001 0.328 1.218
vehicle-attributes-recognition-barrier-0039 0.126 0.626
emotions-recognition-retail-0003 0.126 2.483
landmarks-regression-retail-0009 0.021 0.191
facial-landmarks-35-adas-0002 0.042 4.595
person-attributes-recognition-crossroad-0230 0.174 0.735
gaze-estimation-adas-0002 0.139 1.882

 

Reidentification Models / 再识别模子

视频中,举行精准的目的追踪是盘算机视觉的典型应用场景;

它通常会由于一系列的事情而变得相对对照庞大,这些事情可以形貌 "Relatively long absence of an object" / 一个工具相对较长的缺失;

好比,可能由于 occlusion / 遮挡 或者 out-of-frame movement / 框外移动 导致的;

针对这种情形,最好将目的视为 "seen before" / 先前见过的,而不管其在图像中的当前位置,或者距离上次识别出位置经由多长时间;

下面的网络用在以上这种情形,这些网络获取一小我私家的图像,然后将这小我私家的特征在高维空间中举行评估;这些特征向量会举行进一步评估:通过对照欧式距离来确定是否是统一小我私家;

这里提供了几种模子,在性能和正确度之间举行权衡(模子更大,性能更好):

模子名称 庞大度 (GFLOPS) 巨细 (MP) RANK-1 ON MARKET-1501 数据集
person-reidentification-retail-0031 0.028 0.280 92.11%
person-reidentification-retail-0248 0.174 0.183 84.3%
person-reidentification-retail-0249 0.564 0.597 92.9%
person-reidentification-retail-0300 3.521 5.289 96.3%

 

模子名称 庞大度 (GFLOPS) 巨细 (MP) RANK-1 ON MARKET-1501 数据集
face-reidentification-retail-0095 0.588 1.107 99.33%

 

Semantic Segmentation Models / 语义支解模子

语义支解可以归为目的检测的拓展问题;

返回的不是特征框,语义支解模子返回输入图像(图像中每个像素的颜色代表着特定的种别)的 Painted version / 涂色块

这些网络比目的检测网络要庞大的多,然则提供了一个像素级别的分类,属于统一类的像素会被归为一类(涂上相同颜色),而且可以检测到庞大图形中的空间(好比门路中的可用区域);

模子名称 庞大度(GFLOPS) 巨细 (MP)
road-segmentation-adas-0001 4.770 0.184
semantic-segmentation-adas-0001 58.572 6.686
unet-caMVid-onnx-0001 260.1 31.03
icnet-camvid-ava-0001 151.82 25.45
icnet-camvid-ava-sparse-30-0001 151.82 25.45
icnet-camvid-ava-sparse-60-0001 151.82 25.45

 

Instance Segmentation Models / 实例支解模子

实例支解模子是目的检测和语义支解的拓展;

实例支解模子不是对每个目的实例举行特征框展望剖析,而是为每个实例天生像素级别的遮罩;

模子名称 庞大度 (GFLOPS) 巨细 (MP)
instance-segmentation-security-1025 30.146 26.69
instance-segmentation-security-0050 46.602 30.448
instance-segmentation-security-0083 365.626 143.444
instance-segmentation-security-0010 899.568 174.568

 

Human Pose Estimation Models / 人类姿势估量模子

人体姿势估量义务用来展望姿势:对于输入的图像或者视频,推断出带有特征点和特征点之间毗邻的身体骨骼;特征点是身体器官:好比耳朵,眼睛,鼻子,胳膊,膝盖等等;

有两种主要的分类:top-down / 从上往下bottom-up / 从下往上

第一种方式在给定的帧中,检测出人,然后裁剪和调整,运行姿势估量网络为每个检测出来的人,这种方式很正确;

第二种找到给定的帧中,所有的特征点,然后凭据人的实例举行分类,因此比第一种更快,由于网络只运行了一次;

模子名称 庞大度 (GFLOPS) 巨细 (MP)
human-pose-estimation-0001 15.435 4.099

 

Image Processing / 图像处置

深度学习模子在图像处置中应用来提高输出质量:

模子名称 庞大度 (GFLOPS) 巨细 (MP)
single-image-super-resolution-1032 11.654 0.030
single-image-super-resolution-1033 16.062 0.030
text-image-super-resolution-0001 1.379 0.003

 

Text Detection / 文本检测

深度学习模子在文本检测中举行应用:

模子名称 庞大度 (GFLOPS) 巨细 (MP)
text-detection-0003 51.256 6.747
text-detection-0004 23.305 4.328

 

Text Recognition / 文本识别

深度学习模子在文本识别中应用;

模子名称 庞大度 (GFLOPS) 巨细 (MP)
text-recognition-0012 1.485 5.568
handwritten-score-recognition-0003 0.792 5.555
handwritten-japanese-recognition-0001 117.136 15.31

 

Text Spotting / 文本定位识别

深度学习模子用于文本检测识别;

模子名称 庞大度 (GFLOPS) 巨细 (MP)
text-spotting-0002-detector 185.169 26.497
text-spotting-0002-recognizer-encoder 2.082 1.328
text-spotting-0002-recognizer-decoder 0.002 0.273

 

Action Recognition Models / 动作识别模子

动作识别模子对一个视频短片(通过堆叠来自输入视频的采样帧获得的张量)展望动作;

一些模子从差别的视频片断中提取(好比 driver-action-recognition-adas-0002 可能会使用预盘算的高维度)特征(嵌入) 然后整合到一个暂且模子中,用分类分数来展望一个向量;

盘算嵌入的模子称为 encoder / 编码器,用来展望真实标签的模子称为 decoder / 解码器;

模子名称 庞大度 (GFLOPS) 巨细 (MP)
driver-action-recognition-adas-0002-encoder 0.676 2.863
driver-action-recognition-adas-0002-decoder 0.147 4.205
action-recognition-0001-encoder 7.340 21.276
action-recognition-0001-decoder 0.147 4.405
asl-recognition-0004 6.660 4.133

 

Image Retrieval / 图像检索

深度学习模子用来举行图像检索(凭据相似度对图像举行排序);

模子名称 庞大度 (GFLOPS) 巨细 (MP)
image-retrieval-0001 0.613 2.535

 

Compressed Models / 压缩模子

深度学习压缩模子;

模子名称 庞大度 (GFLOPS) 巨细 (MP)
resnet50-binary-0001 1.002 7.446
resnet18-xnor-binary-onnx-0001 - -

 

迎接使用 Intel OpenVINO Toolkit 举行 AI 开发,OpenVINO(SW)+ MyriadX VPU(HW) 主要侧重于 Inference 推算时的加速,借助 Intel VPU 可以对边缘端装备推演时举行加速;

我会在之后的 blog 内里更新详细的 sample code 的用法;

开发过程中若有问题迎接留言;

,

进入sunbet官网手机

欢迎进入进入sunbet官网手机!Sunbet 申博提供申博开户(sunbet开户)、SunbetApp下载、Sunbet客户端下载、Sunbet代理合作等业务。

Sunbet声明:该文看法仅代表作者自己,与本平台无关。转载请注明:威海景点排行榜:【翻译】OpenVINO Pre-Trained 预训练模子先容

网友评论

  • (*)

最新评论

  • Allbet手机版下载 2020-07-31 00:09:14 回复

    联博统计www.326681.com采用以太坊区块链高度哈希值作为统计数据,联博以太坊统计数据开源、公平、无任何作弊可能性。联博统计免费提供API接口,支持多语言接入。啊接下来发生啥了

    1

标签列表

    文章归档

      站点信息

      • 文章总数:663
      • 页面总数:0
      • 分类总数:8
      • 标签总数:943
      • 评论总数:287
      • 浏览总数:11725