python 之 opencv-摄像头采集和视频播放

打开摄像头


要使用摄像头,需要使用cv2.VideoCapture(0)创建VideoCapture对象,参数0指的是摄像头的编号,如果你电脑上有两个摄像头的话,访问第2个摄像头就可以传入1,依此类推。

capture.read

函数返回的第1个参数ret(return value缩写)是一个布尔值,表示当前这一帧是否获取正确

cv2.cvtColor

用来转换颜色,这里将彩色图转成灰度图

cap.get(propId)cap.set(propId,value)

通过cap.get(propId)可以获取摄像头的一些属性,比如捕获的分辨率,亮度和对比度等。propId是从0~18的数字,代表不同的属性,完整的属性列表可以参考:VideoCaptureProperties。也可以使用cap.set(propId,value)来修改属性值

经验之谈:某些摄像头设定分辨率等参数时会无效,因为它有固定的分辨率大小支持,一般可在摄像头的资料页中找到。

播放本地视频


跟打开摄像头一样,如果把摄像头的编号换成视频的路径就可以播放本地视频了。回想一下cv2.waitKey(),它的参数表示暂停时间,所以这个值越大,视频播放速度越慢,反之,播放速度越快,通常设置为25或30。

1
2
3
4
5
6
7
8
9
10
# 播放本地视频
capture = cv2.VideoCapture('demo_video.mp4')

while(capture.isOpened()):
ret, frame = capture.read()
gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

cv2.imshow('frame', gray)
if cv2.waitKey(30) == ord('q'):
break

录制视频


之前我们保存图片用的是cv2.imwrite(),要保存视频,我们需要创建一个VideoWriter的对象,需要给它传入四个参数:

  • 输出的文件名,如’output.avi’
  • 编码方式FourCC
  • 帧率FPS
  • 要保存的分辨率大小

FourCC是用来指定视频编码方式的四字节码,所有的编码可参考Video Codecs。如MJPG编码可以这样写: cv2.VideoWriter_fourcc(*'MJPG')cv2.VideoWriter_fourcc('M','J','P','G')

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
capture = cv2.VideoCapture(0)

# 定义编码方式并创建VideoWriter对象
fourcc = cv2.VideoWriter_fourcc(*'MJPG')
outfile = cv2.VideoWriter('output.avi', fourcc, 25., (640, 480))

while(capture.isOpened()):
ret, frame = capture.read()

if ret:
outfile.write(frame) # 写入文件
cv2.imshow('frame', frame)
if cv2.waitKey(1) == ord('q'):
break
else:
break

OpenCV VideoCapture.get()参数中文详解,不太准确供参考

练习


  • 实现一个可以拖动滑块播放视频的功能。(提示:需要用到 cv2.CAP_PROP_FRAME_COUNTcv2.CAP_PROP_POS_FRAMES两个属性)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
import cv2


def changetime(x):
return capture.set(cv2.CAP_PROP_POS_FRAMES, x)

# 播放本地视频
capture = cv2.VideoCapture('demo_video.mp4')
#获取视频帧长度
frame_count = capture.get(cv2.CAP_PROP_FRAME_COUNT)
#创建一个窗口
cv2.namedWindow('video')
# 创建视频滑动条
cv2.createTrackbar('video', 'video', 0, int(frame_count), changetime)

height = capture.get(cv2.CAP_PROP_FRAME_HEIGHT)
width = capture.get(cv2.CAP_PROP_FRAME_WIDTH)
print(capture.set(cv2.CAP_PROP_FRAME_HEIGHT, height * 2))
print(capture.set(cv2.CAP_PROP_FRAME_WIDTH, width * 2))

while(capture.isOpened()):
ret, frame = capture.read()

if ret == True:
cv2.setTrackbarPos('video','video',int(capture.get(cv2.CAP_PROP_POS_FRAMES)))
cv2.imshow('video', frame)
if cv2.waitKey(30) == ord('q'):
break
else:
break

python 之 opencv-matplotlib显示图片

Matplotlib


Matplotlib是Python的一个很常用的绘图库,有兴趣的可以去官网学习更多内容。

显示灰度图

1
2
3
4
5
6
7
8
import cv2
import matplotlib.pyplot as plt

img = cv2.imread('lena.jpg', 0)

# 灰度图显示,cmap(color map)设置为gray
plt.imshow(img, cmap='gray')
plt.show()

结果如下:

plt.show()和plt.imshow()的区别

plt.imshowcmap颜色参数选择


显示彩色图

OpenCV中的图像是以BGR的通道顺序存储的,但Matplotlib是以RGB模式显示的,所以直接在Matplotlib中显示OpenCV图像会出现问题,因此需要转换一下

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import cv2
import matplotlib.pyplot as plt

img = cv2.imread('lena.jpg')
img2 = img[:, :, ::-1]
# 或使用
# img2 = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

# 显示不正确的图
plt.subplot(121),plt.imshow(img)

# 显示正确的图
plt.subplot(122)
plt.xticks([]), plt.yticks([]) # 隐藏x和y轴
plt.imshow(img2)

plt.show()

img[:,:,0]表示图片的蓝色通道,img[:,:,::-1]就表示BGR翻转,变成RGB,说明一下:

熟悉Python的童鞋应该知道,对一个字符串s翻转可以这样写:s[::-1],’abc’变成’cba’,-1表示逆序。图片是二维的,所以完整地复制一副图像就是:

1
img2 = img[:,:] # 写全就是:img2 = img[0:height,0:width]

而图片是有三个通道,相当于一个长度为3的字符串,所以通道翻转与图片复制组合起来便是img[:,:,::-1]

结果如下:

加载和保存图片

不使用OpenCV,Matplotlib也可以加载和保存图片:

1
2
3
4
5
6
7
8
import matplotlib.image as plt

img = plt.imread('lena.jpg')
plt.imshow(img)

# 保存图片,需放在show()函数之前
plt.savefig('lena2.jpg')
plt.show()

python 之 opencv-简单读取操作

前言

这几天看了很多关于图像处理的知识,知道神经网络是怎么回事,深度学习是什么东西,机器学习和他们有什么联系,又看了python语言下如何进行图像处理。我认为在接受更高层次的处理手段和算法设计前,应该打好基础,python的图像处理,学好PIL库和opencv库,我在github上找了个opencv的教程,接下来就是对opencv重点的一些备注


安装


pip install opencv-python

  • 安装测试

python --version
import cv2  or  print(cv2.__version__) # '3.4.1'


使用清华镜像在python中pip安装


  • 临时使用:

可以在使用pip的时候加参数-i https://pypi.tuna.tsinghua.edu.cn/simple

例如:pip install -i https://pypi.tuna.tsinghua.edu.cn/simple gevent,这样就会从清华这边的镜像去安装gevent库。


opencv入门


  • OpenCV中彩色图是以B-G-R通道顺序存储的,灰度图只有一个通道
  • 图像坐标的起始点是在左上角,所以行对应的是y,列对应的是x
1
2
3
4
5
6
7
8
9
10
11
12
13
import cv2

# 开始计时
start = cv2.getTickCount()

# 读入一张图片
img = cv2.imread('lena.jpg')

# 停止计时
end = cv2.getTickCount()

# 单位:s
print((end - start) / cv2.getTickFrequency())

cv2.imread

1
2
3
4
import cv2

# 加载灰度图
img = cv2.imread('lena.jpg', 0)
  • 参数1:图片的文件名

    • 如果图片放在当前文件夹下,直接写文件名就行了,如’lena.jpg’
    • 否则需要给出绝对路径,如’D:\OpenCVSamples\lena.jpg’
  • 参数2:读入方式,省略即采用默认值

    • cv2.IMREAD_COLOR:彩色图,默认值(1)
    • cv2.IMREAD_GRAYSCALE:灰度图(0)
    • cv2.IMREAD_UNCHANGED:包含透明通道的彩色图(-1)

经验之谈:路径中不能有中文噢,并且没有加载成功的话是不会报错的,print(img)的结果为None,后面处理才会报错,算是个小坑。


cv2.imshowcv2.waitKey


使用cv2.imshow()显示图片,窗口会自适应图片的大小:

1
2
cv2.imshow('lena', img)
cv2.waitKey(0)

参数1是窗口的名字,参数2是要显示的图片。不同窗口之间用窗口名区分,所以窗口名相同就表示是同一个窗口


cv2.waitKey()是让程序暂停的意思,参数是等待时间(毫秒ms)。时间一到,会继续执行接下来的程序,传入0的话表示一直等待。等待期间也可以获取用户的按键输入:k = cv2.waitKey(0)


cv2.namedWindow


我们也可以先用cv2.namedWindow()创建一个窗口,之后再显示图片:

1
2
3
4
# 先定义窗口,后显示图片
cv2.namedWindow('lena2', cv2.WINDOW_NORMAL)
cv2.imshow('lena2', img)
cv2.waitKey(0)

参数1依旧是窗口的名字,参数2默认是cv2.WINDOW_AUTOSIZE,表示窗口大小自适应图片,也可以设置为cv2.WINDOW_NORMAL,表示窗口大小可调整。图片比较大的时候,可以考虑用后者。


cv2.imwrite


使用cv2.imwrite()保存图片,参数1是包含后缀名的文件名:

1
cv2.imwrite('lena_gray.jpg', img)

练习

  • 打开lena.jpg并显示,s如果按下’s’,就保存图片为’lena_save.bmp’,否则就结束程序
1
2
3
4
5
6
7
8
9
import cv2

img = cv2.imread('lena.jpg')
cv2.imshow('lena', img)

k = cv2.waitKey(0)
# ord()用来获取某个字符的编码
if k == ord('s'):
cv2.imwrite('lena_save.bmp', img)
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×