人工智能大数据与深度学习 公众号:datayx
主要关注手机摄像头进行文档数字化过程中存在纸张几何形变、相机方向导致的透视形变、光照不均导致的阴影等问题。利用3维建模软件由平整文档图像合成了含有上述问题的畸变图像,生成过程中得到的Flow和平整文档图像作为Ground-truth。论文提出先对文档图像进行切分,以Patch为单位利用一个深度学习网络进行训练,从而降低了数据的复杂度,同时也利于进行数据增广。同时提出一个新颖的拼接方法:在梯度域对网络输出的每个Patch的Distortion Flow进行拼接得到整图的Distortion Flow,再得到矫正后的图像。此外,本文还提出一个独立的光照矫正网络,网络可以去除矫正后图像的阴影,进一步提高文档图像的阅读质量和OCR的准确性。在利用单一图像进行矫正的研究中,本文方法取得了最好的结果。
代码和数据集 获取方式
关注微信公众号 datayx 然后回复 矫正 即可获取。
数据合成方法:本文的数据是通过Blender软件合成的,通过软件一系列设定和操作实现拍摄角度、光照环境、扭曲、反射、光泽等的变化,由平整的的文档图像合成畸变的文档图像。
您可以从这里下载一个包含20个样本(438MB)的小数据集,也可以从BitTorrent或OneDrive下载包含2450个样本(65GB)的完整数据集。
The first thing you need to do is to crop the dataset to patches for training. Change arguments to your own and run the following commands. For help message about optional arguments, run python xxx.py --h
不断更新资源
深度学习、机器学习、数据分析、python
搜索公众号添加: datayx
机大数据技术与机器学习工程
搜索公众号添加: datanlp
标签:矫正,Flow,datayx,源码,文档,图像,CNN,数据 From: https://blog.51cto.com/u_15404184/5819247