17611538698
info@21cto.com

图像识别技术的基本原理

作者 Admin 分类 资讯 11月04日
导读:本文为讲解图像识别的基本原理,可谓言简意赅,值得收藏。

 

何为图像识别技术

 

文本识别,人脸识别都是图像识别的应用,但是这只是图像识别的基本应用。先进的技术已经能够识别出猫还是狗来了。

 

它们是怎样做到的?在专门研究图像识别技术的专家的透露出一些原理,本文就综合给大家。

 

人类在确定物体之前先确定其轮廓,据此原理,图像识别技术也依此理,首先识别的是图像的轮廓。

 

 

美国加利福尼亚大学的Adit Deshpande写过一篇《理解卷积神经网络的初学者指南》的文章。在其中,作者以一种相当容易理解的方式介绍了图像识别算法和基本成因。

 

计算机会将图像转换为数字形式的数组——因此“图像识别”实际上对数字数组的分析。在通常情况下,开发者可以将图像缩小到49*49像素,并将每个像素的彩色信息转换为灰度值,以获得49*49的矩阵,以排除其它信息。

 

接下来,从左上角逐一取出一小块数组进行计算。如下图示:

 

请看如下范例:

 

 

左边的图是7x7的灰度矩阵,右边的图是曲线。曲线的边缘灰度值较高,其它位置值全为“0”。

 

从现在开始尝试进行图像识别,以下是只老鼠的图像:

 

以左上角块为例,将其转换为灰色矩阵,将矩阵重叠处的数字相乘,得出结果为6600,这是一个很大的数字。

 

而对老鼠的头部矩阵进行运算,其得出的值为0.

小结

 

针对于图像扫描的结论是,当计算结果值较大时,图像匹配部分也会很多。通常,需要预先准备很多模式,为每个数组块计算最佳模式,最后再判断整体。

 

作者:天机

来源:21CTO

评论