图像识别技术
一幅图像可以定义为一个二维数组f(x,y),这里x,y是空间坐标,而在任何一对空间坐标(x,y)上的幅值f称为该点图像的强度或灰度。当x,y和幅值f为有限的、离散的数值时,称该图像为数字图像。图像的数字化处理:如果要得到图像中的信息,首先对图像进行灰度化、二值化、抑噪(滤波)等技术处理,我们称之为图像的数字化处理。
字符分割:数字化处理之后,是字符分割。字符分割包括从验证码图像中分割出字符区域和把字符区域划分成单个字符两个部分。如果采用统计特征匹配以及神经网络法识别,必须要先分割出单个的字符。简单的分割方法包括等距分割、积分投影分割、交叉点分割、求连通区等。其中,粘连字符的分割是一个难点,复杂的粘连情况下分割比较困难,是一个硬人工智能问题。
字符识别:字符分割完成之后,的工作是字符识别。字符识别就是把处理后的图片还原回字符文本的过程。可以分成基于字符分割的识别(包括采用神经网络、SVM、各种统计距离的识别法)和模板匹配法识别。字符识别的常用做法是:先获取该字符的特征码,然后使用各种分类算法将对该特征码进行分类,将其打上相应的类标签。分类模型的训练,是对字符库中的每个字符进行特征化处理,得到每个字符的特征码,该字符的标签就是该字符本身,利用特征码加上字符的标签对字符库中的所有数据进行训练,得到相应的分类模型。当然,得到待识别字符的特征码后,也可以使用相似性度量和字符库中的字符的特征码进行比较,将该字符识别为与其特征码相似性最高的字符。
大量图片的情况,人力无法全量完成,以前只能缩小采样范围,现在可以进行全量匹配。 对于房地产数据的采集有很大的跨越。
之前有图片的网站的开发是相对较困难的,没办法实现,但是现在这些已经不是问题,采集的范围将更加广泛。
随着计算机技术和信息科学技术的日益进步,图像识别这个领域在现代生活中的普及越来越广泛, 图像识别包括条码识别、人脸识别、指纹识别、智能交通中的动态对象识别等等。