主页 > 玩家风采 >
基于图像处理的碎纸拼接数学模型分析

发布时间:2019-09-14 09:52 作者:李明发 来源:原创

目前,碎纸的大部分拼接工作都是手工完成的,但当碎纸的数量很大时,很难完成拼接。国内对该技术的研究主要集中在文物的自动修复,虚拟考古,故障分析,计算机辅助设计,医学分析等方面。此外,破损文件的拼接在司法证据的恢复中,历史文献的恢复和军事在情报获取等领域也有很多应用。

传统的碎纸缝合方法通常基于碎纸的边缘特征的几何特征,例如尖点,尖角,区域等,然后搜索匹配的纸张以完成缝合。然而,这种拼接方法基于纸张边缘的几何特征,当有许多具有相似边缘几何特征的纸张时,这种拼接方法不适用。因此,本文着重于基于论文建立文本特征。该模型完成了纸屑的拼接。

2.问题分析

碎纸自动拼接技术是图像处理和模式识别领域的一种相对较新但典型的应用。它是通过计算机扫描和图像提取技术获得的,以获得一组碎纸的形状,颜色和特征。然后,计算机执行相应的处理以实现这些纸张的自动和半自动缝合减少。碎纸自动拼接技术的关键包括图像预处理和匹配,其中预处理的目的是将碎纸表示为适合于计算机处理的形式。预处理包括图像采集和处理,并且可以在具有不同边界特征的纸张上执行边界检测,轮廓提取和表示。纸张的匹配技术是碎纸自动拼接的关键,即利用建立的模型,设计算法识别和自动拼接纸张。

由于所讨论的碎纸具有相同的边缘几何形状,因此不可能通过提取尖锐边缘,尖角和碎片区域的常规方法来区分不同的碎片。对于具有相似边缘的这种花键纸拼接,理想的计算机拼接过程应该类似于手工拼接过程,并且拼接不仅要考虑拼接碎纸的边缘是否匹配,还要判断拼接纸的字符是否匹配。碎片或碎片中的字符。然而,由于理论和技术限制,内容是否匹配,几乎不可能有一个具有类似人类特征的计算机识别片段边缘的碎片和理解文本内容的智能。分段。然而,利用现有技术,可以获得诸如废纸的内部和边缘的几何特征以及纸张的不同部分的颜色之类的信息。当执行自动缝合时,只能找到具有相同边缘特征的纸张。因此,解决问题的关键是设计合适的匹配算法并执行错误控制。

另一方面,由于计算机数字分析图像能力的缺陷,计算机几乎不可能完全自动拼接碎片。为了确保拼接的准确性,有必要在拼接过程中添加手动干涉过程。

3.模型审查

在拼接纸张拼接之前,我们所做的是使用扫描仪处理纸质文档片段并以BMP格式输出原始图像。在模型中,我们首先假设在边缘上没有两张具有相同文本特征的纸张,然后将碎纸片的图像处理二值化,转换成仅包含0和1的矩阵,最后通过算法匹配。相应的论文。对于具有相似边缘的纸张的拼接,理想的计算机拼接过程不仅要考虑拼接的碎纸边缘是否匹配,还要判断碎纸中的破碎字符或碎片中的文本内容是否匹配。理论与技术。具有这种人工智能的计算机的限制仍然非常困难,因此还必须在相应的时间节点处添加人工干预。

4.假设条件

(1)假设不存在四个边界几何特征都一样的两张纸片。

(2)假设碎纸片当中只存在黑白两种颜色。

(3)假设正确拼接完成后的完整纸张的边界是全白的,即没有文字被切割。

(4)假设纸张内的文字行是平行且单一的。

(5)假设纸片内同一文字行的高度、间距是相等的。

5.模型的建立

二值图像是指每个像素不是黑就是白,其灰度值没有中间过渡的图像。二值图像一般用来描述文字或者图形,其优点是占用空间少,缺点是,当表示人物,风景的图像时,二值图像只能描述其轮廓,不能描述细节。这时候用更高的灰度级。

二值图像中所有的像素只能从0和1这两个值中取,因此在MATLAB中,二值图像用一个由0和1组成的二维矩阵表示。这两个可取的值分别对应于关闭和打开,关闭表征该像素处于背景,而打开表征该像素处于前景。以这种方式来操作图像可以更容易识别出图像的结构特征。

建立将图片转化为二值化理想模型,方便进行数值处理。

在碎纸片拼接中,通过计算一张纸片边缘一列的向量,与另一张纸片最边缘一列的向量,比较相似度的大小,找出边缘最相似的矩阵进行拼接。同时,假设纸张内的文字行是平行且单一的,纸片内同一文字行的高度、间距是相等的,所以同一行碎纸片的上下空白高度具有类似的特征。

基于图像处理的碎纸拼接数学模型分析

6.算法设计

(1)将每张图片先转化为矩阵,信息储存在矩阵中,再进行二值化处理,将每张图的信息储存在一个二维数组w(x,y)中。

(2)求出每张图字符距离上下边缘的距离,存在两个数组cal_up与cal_down中。

(3)先筛选出最左边或者最右边的可能图片,利用人工干预进行调整,排列出图片的第一列和最后一列,记录下正确的排序。

基于图像处理的碎纸拼接数学模型分析

(4)从第一列的第一张图片开始向后拼接,求边缘相减的最小值,进行筛选,直至最后第一列的最后一张图片。最后检查图片是否正确,记录下正确的排序。

(5)从最后列的第一张图片开始向前拼接,直至最后第一列的最后一张图片,利用相同的算法,检查图片是否正确,记录下正确的排序。

(6)对于仍然缺失的图片进行人工干预,最终补充完全。

7.结论

本文所提出的基于碎纸片边界特征的拼接方法,巧妙利用图像处理技术,使问题分析更加明显,简化,便于计算。对于大量的图片,具有结合人工干预,效率较高。分析表明,当碎片总数量较少时,拼接计算工作量在允许范围内,如果对算法作些改进,拼接计算量可大幅度减少。[科]

推荐文章

热门文章

东森游戏平台专业提供东森注册开户、相关产品和服务。东森官方注册是行业中极具实力的品牌销售和服务机构。

CopyRight © 版权所有: 东森娱乐科技有限公司 备案号:浙ICB备82719号