2020-03-30

Image Processing

5 minutes read (About 824 words)

python 之 opencv-摄像头采集和视频播放

打开摄像头

要使用摄像头，需要使用cv2.VideoCapture(0)创建VideoCapture对象，参数0指的是摄像头的编号，如果你电脑上有两个摄像头的话，访问第2个摄像头就可以传入1，依此类推。

capture.read

函数返回的第1个参数ret(return value缩写)是一个布尔值，表示当前这一帧是否获取正确

cv2.cvtColor

用来转换颜色，这里将彩色图转成灰度图

cap.get(propId)、cap.set(propId,value)

通过cap.get(propId)可以获取摄像头的一些属性，比如捕获的分辨率，亮度和对比度等。propId是从0~18的数字，代表不同的属性，完整的属性列表可以参考：VideoCaptureProperties。也可以使用cap.set(propId,value)来修改属性值

经验之谈：某些摄像头设定分辨率等参数时会无效，因为它有固定的分辨率大小支持，一般可在摄像头的资料页中找到。

播放本地视频

跟打开摄像头一样，如果把摄像头的编号换成视频的路径就可以播放本地视频了。回想一下cv2.waitKey()，它的参数表示暂停时间，所以这个值越大，视频播放速度越慢，反之，播放速度越快，通常设置为25或30。

# 播放本地视频
capture = cv2.VideoCapture('demo_video.mp4')

while(capture.isOpened()):
    ret, frame = capture.read()
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    cv2.imshow('frame', gray)
    if cv2.waitKey(30) == ord('q'):
        break

录制视频

之前我们保存图片用的是cv2.imwrite()，要保存视频，我们需要创建一个VideoWriter的对象，需要给它传入四个参数：

输出的文件名，如’output.avi’
编码方式FourCC码
帧率FPS
要保存的分辨率大小

FourCC是用来指定视频编码方式的四字节码，所有的编码可参考Video Codecs。如MJPG编码可以这样写： cv2.VideoWriter_fourcc(*'MJPG')或cv2.VideoWriter_fourcc('M','J','P','G')

capture = cv2.VideoCapture(0)

# 定义编码方式并创建VideoWriter对象
fourcc = cv2.VideoWriter_fourcc(*'MJPG')
outfile = cv2.VideoWriter('output.avi', fourcc, 25., (640, 480))

while(capture.isOpened()):
    ret, frame = capture.read()

    if ret:
        outfile.write(frame)  # 写入文件
        cv2.imshow('frame', frame)
        if cv2.waitKey(1) == ord('q'):
            break
    else:
        break

OpenCV VideoCapture.get()参数中文详解，不太准确供参考

练习

实现一个可以拖动滑块播放视频的功能。（提示：需要用到 cv2.CAP_PROP_FRAME_COUNT和cv2.CAP_PROP_POS_FRAMES两个属性）

import cv2


def changetime(x):
    return capture.set(cv2.CAP_PROP_POS_FRAMES, x)

# 播放本地视频
capture = cv2.VideoCapture('demo_video.mp4')
#获取视频帧长度
frame_count = capture.get(cv2.CAP_PROP_FRAME_COUNT)
#创建一个窗口
cv2.namedWindow('video')
# 创建视频滑动条
cv2.createTrackbar('video', 'video', 0, int(frame_count), changetime)

height = capture.get(cv2.CAP_PROP_FRAME_HEIGHT)
width = capture.get(cv2.CAP_PROP_FRAME_WIDTH)
print(capture.set(cv2.CAP_PROP_FRAME_HEIGHT, height * 2))
print(capture.set(cv2.CAP_PROP_FRAME_WIDTH, width * 2))

while(capture.isOpened()):
    ret, frame = capture.read()

    if ret == True:
        cv2.setTrackbarPos('video','video',int(capture.get(cv2.CAP_PROP_POS_FRAMES)))
        cv2.imshow('video', frame)
        if cv2.waitKey(30) == ord('q'):
            break
    else:
        break

2020-03-30

Image Processing

3 minutes read (About 452 words)

python 之 opencv-matplotlib显示图片

Matplotlib

Matplotlib是Python的一个很常用的绘图库，有兴趣的可以去官网学习更多内容。

显示灰度图

import cv2
import matplotlib.pyplot as plt

img = cv2.imread('lena.jpg', 0)

# 灰度图显示，cmap(color map)设置为gray
plt.imshow(img, cmap='gray')
plt.show()

结果如下：

plt.show()和plt.imshow()的区别

plt.imshow 的cmap颜色参数选择

显示彩色图

OpenCV中的图像是以BGR的通道顺序存储的，但Matplotlib是以RGB模式显示的，所以直接在Matplotlib中显示OpenCV图像会出现问题，因此需要转换一下

import cv2
import matplotlib.pyplot as plt

img = cv2.imread('lena.jpg')
img2 = img[:, :, ::-1]
# 或使用
# img2 = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

# 显示不正确的图
plt.subplot(121),plt.imshow(img) 

# 显示正确的图
plt.subplot(122)
plt.xticks([]), plt.yticks([]) # 隐藏x和y轴
plt.imshow(img2)

plt.show()

img[:,:,0]表示图片的蓝色通道，img[:,:,::-1]就表示BGR翻转，变成RGB，说明一下：

熟悉Python的童鞋应该知道，对一个字符串s翻转可以这样写：s[::-1]，’abc’变成’cba’，-1表示逆序。图片是二维的，所以完整地复制一副图像就是：

1	img2 = img[:,:] # 写全就是：img2 = img[0:height,0:width]

而图片是有三个通道，相当于一个长度为3的字符串，所以通道翻转与图片复制组合起来便是img[:,:,::-1]。

结果如下：

加载和保存图片

不使用OpenCV，Matplotlib也可以加载和保存图片：

import matplotlib.image as plt

img = plt.imread('lena.jpg')
plt.imshow(img)

# 保存图片，需放在show()函数之前
plt.savefig('lena2.jpg')
plt.show()

2020-03-29

Image Processing

6 minutes read (About 877 words)

python 之 opencv-简单读取操作

前言

这几天看了很多关于图像处理的知识，知道神经网络是怎么回事，深度学习是什么东西，机器学习和他们有什么联系，又看了python语言下如何进行图像处理。我认为在接受更高层次的处理手段和算法设计前，应该打好基础，python的图像处理，学好PIL库和opencv库，我在github上找了个opencv的教程，接下来就是对opencv重点的一些备注

安装

pip install opencv-python

安装测试

python --version
import cv2 or print(cv2.__version__) # '3.4.1'

使用清华镜像在python中pip安装

临时使用：

可以在使用pip的时候加参数-i https://pypi.tuna.tsinghua.edu.cn/simple

例如：pip install -i https://pypi.tuna.tsinghua.edu.cn/simple gevent，这样就会从清华这边的镜像去安装gevent库。

opencv入门

OpenCV中彩色图是以B-G-R通道顺序存储的，灰度图只有一个通道
图像坐标的起始点是在左上角，所以行对应的是y，列对应的是x

import cv2

# 开始计时
start = cv2.getTickCount()

# 读入一张图片
img = cv2.imread('lena.jpg')

# 停止计时
end = cv2.getTickCount()

# 单位：s
print((end - start) / cv2.getTickFrequency())

cv2.imread

import cv2

# 加载灰度图
img = cv2.imread('lena.jpg', 0)

参数1：图片的文件名
- 如果图片放在当前文件夹下，直接写文件名就行了，如’lena.jpg’
- 否则需要给出绝对路径，如’D:\OpenCVSamples\lena.jpg’
参数2：读入方式，省略即采用默认值
- cv2.IMREAD_COLOR：彩色图，默认值(1)
- cv2.IMREAD_GRAYSCALE：灰度图(0)
- cv2.IMREAD_UNCHANGED：包含透明通道的彩色图(-1)

经验之谈：路径中不能有中文噢，并且没有加载成功的话是不会报错的，print(img)的结果为None，后面处理才会报错，算是个小坑。

cv2.imshow、cv2.waitKey

使用cv2.imshow()显示图片，窗口会自适应图片的大小：

1 2	cv2.imshow('lena', img) cv2.waitKey(0)

参数1是窗口的名字，参数2是要显示的图片。不同窗口之间用窗口名区分，所以窗口名相同就表示是同一个窗口

cv2.waitKey()是让程序暂停的意思，参数是等待时间（毫秒ms）。时间一到，会继续执行接下来的程序，传入0的话表示一直等待。等待期间也可以获取用户的按键输入：k = cv2.waitKey(0)

cv2.namedWindow

我们也可以先用cv2.namedWindow()创建一个窗口，之后再显示图片：

# 先定义窗口，后显示图片
cv2.namedWindow('lena2', cv2.WINDOW_NORMAL)
cv2.imshow('lena2', img)
cv2.waitKey(0)

参数1依旧是窗口的名字，参数2默认是cv2.WINDOW_AUTOSIZE，表示窗口大小自适应图片，也可以设置为cv2.WINDOW_NORMAL，表示窗口大小可调整。图片比较大的时候，可以考虑用后者。

cv2.imwrite

使用cv2.imwrite()保存图片，参数1是包含后缀名的文件名：

1	cv2.imwrite('lena_gray.jpg', img)

练习

打开lena.jpg并显示，s如果按下’s’，就保存图片为’lena_save.bmp’，否则就结束程序

import cv2

img = cv2.imread('lena.jpg')
cv2.imshow('lena', img)

k = cv2.waitKey(0)
# ord()用来获取某个字符的编码
if k == ord('s'):
    cv2.imwrite('lena_save.bmp', img)

python 之 opencv-摄像头采集和视频播放

打开摄像头

capture.read

cv2.cvtColor

cap.get(propId)、cap.set(propId,value)

播放本地视频

录制视频

练习

python 之 opencv-matplotlib显示图片

Matplotlib

显示灰度图

显示彩色图

加载和保存图片

python 之 opencv-简单读取操作

前言

安装

使用清华镜像在python中pip安装

opencv入门

cv2.imread

cv2.imshow、cv2.waitKey

cv2.namedWindow

cv2.imwrite

练习

Links

Categories

Tag Cloud

Recent

Archives

Tags

Recent

Archives

Tags

Your browser is out-of-date!