python识别图片中的数字:使用OpenCV进行数字识别

2021年11月7日15:42:41 发表评论 2,999 次浏览
python识别图片中的数字:使用OpenCV进行数字识别
python OpenCV进行数字识别

python识别图片中的数字:我使用 OpenCV 框架编写了一个 python 脚本来检测信用卡或保险卡上的数字。

它是如何工作的?

该代码仅作为两部分工作。第一部分的目的是用可能的图像训练脚本。培训完成后,您可以测试您的扫描图像(即信用卡或保险卡)。

python如何识别图片中的数字?样本识别输出

在这里您可以看到成功识别数字的输出:

python识别图片中的数字:使用OpenCV进行数字识别

要安装的框架

Python-2.7.x.
numpy
opencv

python识别图片中的数字:训练脚本的代码

#!/usr/bin/python
# -*- coding: utf8 -*-

#################################################################
# File name: digit_recognizer_training.py                       #
# Description: Train digits on an image and save them as files. #
# Version: 0.0.1                                                #
# Author: Gökhan Sari                                           #
# E-mail: g-sari@g-sari.com                                     #
#################################################################

import sys
import cv2
import numpy as np
from picture import Pic


class DigitRecognizerTraining:
    """Class used to train digits on an image"""

    def __init__(self):
        self.training_pics = [Pic(), Pic(pic_name="ocr_insurance_card_train_2.jpg", contour_dimension_from_h=21, contour_dimension_to_h=28)]

    def train(self):
        """Method to train digits"""
        # Loop all images to train
        for training_pic in self.training_pics:
            im = cv2.imread(training_pic.pic_name)
            gray = cv2.cvtColor(im, cv2.COLOR_BGR2GRAY)
            blur = cv2.GaussianBlur(gray, (5, 5), 0)
            thresh = cv2.adaptiveThreshold(blur, 255, 1, 1, 11, 1)
            _, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
            samples = np.empty((0, 100))
            responses = []
            keys = [i for i in range(48, 58)]

            for cnt in contours:
                if cv2.contourArea(cnt) > (training_pic.contour_dimension_to_h * 2):
                    [x, y, w, h] = cv2.boundingRect(cnt)
                    # print("contour:" w, h)
                    if h > training_pic.contour_dimension_from_h and h < training_pic.contour_dimension_to_h:
                        cv2.rectangle(im, (x - 1, y - 1), (x + 1 + w, y + 1 + h), (0, 0, 255), 1)
                        roi = thresh[y:y + h, x:x + w]
                        roismall = cv2.resize(roi, (10, 10))
                        cv2.imshow('Training: Enter digits displayed in the red rectangle!', im)
                        key = cv2.waitKey(0)

                        if key == 27:  # (escape to quit)
                            self.save_data(samples, responses)
                            cv2.destroyAllWindows()
                            sys.exit()
                        elif key in keys:  # (append data)
                            responses.append(int(chr(key)))
                            sample = roismall.reshape((1, 100))
                            samples = np.append(samples, sample, 0)
        # Save collected data
        self.save_data(samples, responses)

    @staticmethod
    def save_data(samples, responses):
        """Method to save trained data"""
        responses = np.array(responses, np.float32)
        responses = responses.reshape((responses.size, 1))
        np.savetxt('ocr_training.data', samples)
        np.savetxt('ocr_responses.data', responses)
        print "training complete"

# Start the training process
if __name__ == '__main__':
    DigitRecognizerTraining().train()

python如何识别图片中的数字:可以通过 Github 访问整个源代码:

g-sari/pyautodigitspyautodigits - 一个 python 跨平台模块,用于识别图像上的数字github.com

python OpenCV进行数字识别:演示训练部分

只需点击显示在红色矩形中的键盘键

如何训练?

打开终端,转到文件夹并运行以下命令:

python digit_recognizer_training.py

如何测试?

打开终端,进入该文件夹,运行以下命令:

python digit_recognizer_testing.py
木子山

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: