Python과 OpenCV – 4 : 마우스 이벤트

원문은 https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_gui/py_mouse_handling/py_mouse_handling.html 입니다.

이미지 처리를 위해 OpenCV에서는 자체적인 마우스 이벤트 체계를 가지고 있습니다. 마우스 이벤트는 cv2.setMouseCallback 함수를 통해 마우스 이벤트를 처리할 Window에 등록됩니다. 먼저 간단한 예를 통해 살펴보겠습니다.

import cv2
import numpy as np

def draw_circle(event, x, y, flags, param):
    if event == cv2.EVENT_LBUTTONDBLCLK:
        cv2.circle(img,(x,y),100,(255,0,0),-1)

img = np.zeros((512,512,3), np.uint8)
cv2.namedWindow('image')
cv2.setMouseCallback('image',draw_circle)

while(1):
    cv2.imshow('image',img)
    if cv2.waitKey(20) & 0xFF == 27:
        break

cv2.destroyAllWindows()

위의 프로그램은 Window 위에서 마우스 버튼을 더블클릭하면 해당 지점에서 파란색 큰 원을 그립니다.

좀더 복잡한 예제를 살펴보겠습니다.

import cv2
import numpy as np

drawing = False
mode = True
ix, iy = -1, -1

def draw_circle(event,x,y,flags,param):
    global ix, iy, drawing, mode

    if event == cv2.EVENT_LBUTTONDOWN:
        drawing = True
        ix, iy = x, y

    elif event == cv2.EVENT_MOUSEMOVE:
        if drawing == True:
            if mode == True:
                cv2.rectangle(img, (ix,iy), (x,y), (0,255,0), -1)
            else:
                cv2.circle(img, (x,y), 5, (0,0,255), -1)

    elif event == cv2.EVENT_LBUTTONUP:
        drawing = False
        if mode == True:
            cv2.rectangle(img, (ix,iy), (x,y), (0,255,0), -1)
        else:
            cv2.circle(img, (x,y), 5, (0,0,255), -1)

img = np.zeros((512,512,3), np.uint8)
cv2.namedWindow('image')
cv2.setMouseCallback('image', draw_circle)

while(1):
    cv2.imshow('image', img)
    k = cv2.waitKey(1) & 0xFF
    if k == ord('m'):
        mode = not mode
    elif k == 27:
        break

cv2.destroyAllWindows()

위의 프로그램은 마우스 드래그를 이용해 사각형과 원을 그릴 수 있는데, m 키를 눌러 그리고자 하는 원과 사각형을 결정할 수 있습니다.

Python과 OpenCV – 3 : 코드로 이미지에 도형 그리기

참조한 글은 https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_gui/py_drawing_functions/py_drawing_functions.html 입니다.

이미지는 사진이나 동영상을 통해 얻을 수도 있지만 코드를 통해서도 생성할 수 있습니다. 아래의 코드는 512×512 크기의 3개의 채널로 되어 있으며 채널의 구성 데이터 타입은 unit8입니다.

import numpy as np
import cv2

img = np.zeros((512,512,3), np.uint8)

이 이미지 위에 다양한 도형을 그리는 코드를 정리해 볼텐데요. 먼저 두점으로 구성된 선분을 그리는 코드입니다.

cv2.line(img, (0,0), (512,512), (255,0,0), 5)

위의 코드는 좌표(0,0)에서 좌표(512,512)로 구성된 선분을 색상은 (B,G,R) 순서인 (255,0,0)인 파란색으로 굵기는 5pixel로 그립니다. 다음 코드는 사각형을 그리는 코드입니다.

cv2.rectangle(img, (384,0), (510,128), (0,255,0), 3)

위의 코드는 좌상단 (384,0)과 우하단 (510,128)인 지사각형을 초록색(0,255,0)으로 3Pixel 굵기로 그립니다. 다음은 원을 그리는 코드입니다.(

cv2.circle(img, (447,63), 63, (0,0,255), -1)

위의 코드는 중심점 (447,63)이고 반지름은 63인 원을 빨간색(0,0,255)으로 하여 굵기속성은 -1로 함으로써 도형을 채움형태로 그리는 코드입니다. 다음은 타원을 그리는 코드입니다.

cv2.ellipse(img, (256,256), (100,50), 45,0,180,(0,0,255),-1)

위의 코드는 중심점이 (256,256)이고 가로 반지름과 세로 반지름을 각각 (100,50)이며, 45도 시계방향으로 회전하고 시작각 0도 종료각 180도인 타원을 빨간색(0,0,255)로 채워진(-1) 타원을 그리는 코드입니다. 다음은 폴리라인을 그리는 코드입니다.

pts = np.array([[10,5],[20,30],[70,20],[50,10]], np.int32)
pts = pts.reshape((-1,1,2))
cv2.polylines(img, [pts], True, (0,255,255))

위의 코드는 총 4개의 좌표로 구성된 pts를 이용해 색상은 BRG값이 각각 (0,255,255)로 하여 폴리곤을 그리는 코드인데.. cv2.polylines의 3번째를 True로 지정하여 폐합(시작점과 끝점을 연결)하도록 그립니다. 마지막으로 문자를 그리는 코드입니다.

font = cv2.FONT_HERSHEY_SIMPLEX
cv2.putText(img, 'OpenCV', (10,500), font, 4, (255,255,255), 2)

위치 (10,500)에 OpenCV라는 문자열을 폰트 크기 4로 하여 백색(255,255,255)로 하여 굵기는 2로 그리는 코드입니다.

지금까지 그린 이미지를 화면에 표시하기 위해 아래의 코드를 덧붙입니다.

cv2.imshow('img', img)
cv2.waitKey()
cv2.destroyAllWindows()

Python과 OpenCV – 2 : 비디오를 가지고 시작하기

원문은 https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_gui/py_video_display/py_video_display.html 입니다. OpenCV에는 카메라를 통해서도 이미지를 받을 수 있습니다. 아래의 코드는 컴퓨터에 연결된 카메라를 통해 영상을 받아 표시하는 코드입니다.

import numpy as np
import cv2

cap = cv2.VideoCapture(0)

print(cap.get(3), cap.get(4))

ret = cap.set(3,320)
ret = cap.set(4,240)

while(True):
    ret, frame = cap.read() 

    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    cv2.imshow('frame', gray)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

4번 코드에서 첫번째(0) 카메라를 VideoCapture 타입의 객체로 얻어옵니다. 6번은 이 카메라의 영상에 대한 가로, 세로에 대한 픽셀 길이를 출력합니다. 필자의 경우 640 480이 출력되었습니다. 8,9번 코드를 통해 가로와 세로의 크기를 각각 320×240으로 변경합니다. q 키를 누를때까지 11번의 반복문이 무한 반복됩니다. 12번에서 카메라로부터 현재의 영상 하나를 읽어오고, 14번에서 이 영상을 Gray로 변환합니다. 16번에서 이 Gray 영상을 Window에 표시합니다. q 키를 눌러 Window를 닫게 되면 프로그램이 종료되는데, 이때 사용한 카메라에 대한 리소스 해제에 대한 코드가 20번입니다.

카메라로부터 영상을 표시할 수도 있지만, 이를 파일로 기록할 수도 있습니다. 이래의 코드처럼요.

import numpy as np
import cv2

cap = cv2.VideoCapture(0)

fourcc = cv2.VideoWriter_fourcc(*'XVID')
out = cv2.VideoWriter('d:/output.mp4', fourcc, 20.0, (640,480))

while(cap.isOpened()):
    ret, frame = cap.read()
    if ret == True:
        frame = cv2.flip(frame, 0)
        out.write(frame)

        cv2.imshow('frame', frame)
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break
    else:
        break

cap.release()
out.release()
cv2.destroyAllWindows()

7번의 코드에서 기록할 동영상 파일명과 프레임률(20), 영상의 크기(640, 480)을 지정합니다. 파일명의 확장자는 mp4나 avi 등이 가능한데, 확장자에 따라 만들어지는 영상의 포멧이 결정됩니다. 실제 영상의 저장은 13번 코드입니다. 테스트로 12번 코드에서 영상을 뒤집어 기록하도록 하였습니다. q 키를 눌러 영상을 기록하는 반복문이 종료되면 비디오 객체를 해제해야 하는데 해당 코드가 바로 21, 22번입니다.

카메라가 아닌 동영상 파일로부터도 영상을 얻어 표시할 수 있는데, 해당 코드는 아래와 같습니다.

import numpy as np
import cv2

cap = cv2.VideoCapture('./data/vtest.avi')

while(cap.isOpened()):
    ret, frame = cap.read()

    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    cv2.imshow('frame',gray)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

카메라를 통한 영상 표시에 대한 코드와 모두 동일한데, 차이점은 단지 4번의 VideoCapture 함수의 인자가 카메라 인덱스가 아닌 파일명이라는 점입니다.

Python과 OpenCV – 1 : 이미지를 가지고 시작하기

원문은 https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_gui/py_image_display/py_image_display.html#display-image 입니다.

OpenCV는 단일 이미지나 동영상의 이미지를 원하는 결과를 분석 및 추출하기 위한 API입니다. OpenCV는 C/C++ 언어로 개발되었고, 이 API를 사용할 수 있는 언어는 C/C++, Java, Python 등입니다. 그리고 활용할 수 있는 플랫폼은 Windows, Linix, Android, iOS 등입니다. 이 글은 OpenCV를 Python 언어를 이용해 학습하면서 정리할 필요가 있다고 판단되는 핵심내용을 꼼꼼이 기록하기 위한 목적을 갖습니다. 각 글에 대한 원문은 글의 서문에 언급해 두고 있으니, 참고하시기 바랍니다. 아울리 이 글은 필자가 원문의 내용을 통해 학습하고 필자 나름대로 재해석하여 글을 작성하고 있습니다. 이 글과 이후의 Python과 OpenCV 관련글은 모두 이와 같습니다.

OpenCV와 Python의 설치 방법은 생략합니다. 검색을 통해 각자 자신에 맞는 환경에 설치하기 바랍니다.

OpenCV는 이미지를 대상으로 어떤 처리를 수행하므로 이미지를 읽고 화면에 표시하는 것은 매우 중요하고 기초적인 내용입니다. 이 글은 바로 이미지를 읽어 화면에 표시하는 내용에 대한 글입니다. 가장 먼저 작성된 코드는 다음과 같습니다.

import numpy as np
import cv2

img = cv2.imread('./data/quark-particle-flavors.jpg', cv2.IMREAD_GRAYSCALE)

cv2.imshow('image', img)

k = cv2.waitKey()

if k == ord('s'):
    cv2.imwrite('d:/z.jpg', img)

cv2.destroyAllWindows()

1,2번 코드는 OpenCV API 사용을 위한 모듈을 불러들이는 코드입니다. OpenCV는 이미지 데이터를 numpy의 자료구조를 사용합니다. 그러므로 OpenCV의 사용에 있어 numpy 모듈은 항상 함께 합니다.

실제 이미지를 불러 들이는 코드는 4번의 cv2.imread 함수인데, 첫번째 인자는 불러드릴 이미지 파일명이며 두번째는 해당 이미지를 불러와 어떤 포맷으로 메모리에 적재해 numpy 자료 구조의 객체를 생성할 것인지입니다. 위의 코드에서는 cv.IMREAD_GRAYSCALE로써 비록 해당 원본 이미지가 RGB의 칼라 이미지이지만 Gray 색상으로 해석해 이미지 객체를 반환하라는 것입니다. cv.IMREAD_GRAYSCALE 이외에도 사용할 수 있는 값은 다음과 같습니다.

  • cv2.IMREAD_COLOR : 별도로 지정하지 않을 경우 사용되는 기본값이며 칼라 이미지로 읽어드림. 이미지의 투명도값은 무시된다.
  • cv2.IMREAD_GRAYSCALE : 이미지를 Grayscale로 읽는다
  • cv2.IMREAD_UNCHANGED : 투명도인 Alpha 채널을 포함하여 읽는다.

반환된 이미지는 img 변수에 담기며 img 변수의 type을 확인해 보면 ‘numpy.ndarray’라는 타입으로 표시됩니다. 이제 이 이미지를 표시하기 위해 6번의 코드인 cv2.imshow 함수가 사용되는데 첫번째 인수는 이미지가 표시되는 Window의 식별자인 이름이고 두번째가 표시되는 이미지 객체입니다. 표시되는 이미지 객체는 4번 코드에서 정의된 변수입니다.

8번 코드는 사용자가 키 입력을 기다리는 함수인 cv2.waitKey로 인자값이 없거나 0일 경우 시간 제한없이 사용자의 키 입력을 기다립니다. 인자가 지정되면 해당값의 시간만큼만 키 입력을 기다립니다.>/p>

10번 코드는 입력된 키값이 소문자 s일 경우 img 객체의 저장된 이미지를 또 다른 파일로 저장하라는 cv2.imwrite 함수입니다.

13번은 프로그램의 종료를 위해 표시된 모든 Window을 닫으라는 코드입니다. 실행해보면 다음 화면과 같습니다.

이미지의 표시는 OpenCV 방식만 있는것이라 아니고 Matplotlib를 사용할 수도 있습니다. 이미지 처리의 결과를 그래프를 통해 효과적으로 표시하기 위해 Matplotlib를 사용합니다. Matplotlib를 이용한 이미지 표시의 코드는 아래와 같습니다.

import numpy as np
import cv2
from matplotlib import pyplot as plt

img = cv2.imread('./data/quark-particle-flavors.jpg', 0)
plt.imshow(img, cmap = 'gray', interpolation = 'bicubic')
plt.xticks([]), plt.yticks([])
plt.show()

실행 결과는 다음과 같습니다.