基于Python实现一键找出磁盘里所有猫照-偶像资源网

前言

最近在整理我磁盘上的照片，发现不少猫照，突然觉得若能把这些猫照都挑出来，观察它们的成长轨迹也是一件不错的事情。一张一张的找实在是太费劲了，能不能自动化地找出来呢？

目标检测，是许多计算机视觉应用的重中之重，比如说我们上次的实例分割：Python 20行代码批量自动抠图，人体关键点提取、人脸识别等。而我们这一次，是要识别猫照。由于时间不多，我们没有时间收集训练集，那么有没有已经训练好的目标检测模型呢？

这时候就要搬出paddlehub了，puddlehub有一个模型叫做YOLOv3，基于 Joseph Redmon和Ali Farhadi提出的单阶段检测器。该检测器与达到同样精度的传统目标检测方法相比，推断速度能达到接近两倍。

YOLOv3将输入图像分成S*S个格子，每个格子预测B个bounding box，每个bounding box预测内容包括: Location(x, y, w, h)、Confidence Score和C个类别的概率，因此我们不仅能够找出猫的照片，还能定位它的位置！甚至能自动数出一张照片里有多少只猫！

1.准备

开始之前，你要确保Python和pip已经成功安装在电脑上,如果没有，可以访问这篇文章：超详细Python安装指南进行安装。

(可选1) 如果你用Python的目的是数据分析，可以直接安装Anaconda，它内置了Python和pip.

(可选2) 此外，推荐大家用VSCode编辑器，它有许多的优点

为了实现识别猫的功能，我们需要安装 paddlepaddle, 进入他们的官方网站就有详细的指引

根据你自己的情况选择这些选项，最后一个CUDA版本，由于本实验不需要训练数据，也不需要太大的计算量，所以直接选择CPU版本即可。选择完毕，下方会出现安装指引，不得不说，Paddlepaddle 这些方面做的还是比较贴心的。

要注意，如果你的Python3环境变量里的程序名称是Python，记得将python3 xxx 语句改为Python xxx 如下进行安装：

python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

你还需要安装paddlehub：

pip install -i https://mirror.baidu.com/pypi/simple paddlehub

2.编写代码

我们先试试单图片识别，找到猫猫：

新建predict.py文件，存放猫照在当前文件夹的imgs文件夹下，命名为c1.jpg. 输入以下代码：

import paddlehub as hub

# 加载模型
yolov3 = hub.Module(name=\"yolov3_darknet53_coco2017\")

# 图片位置
test_img_path = \"imgs/c1.jpg\"

# 输入图片
input_dict = {\"image\": [test_img_path]}

# 输出结果
results = yolov3.object_detection(data=input_dict)
for result in results:
    print(result[\'path\'])
    print(result[\'data\'])

在终端/CMD输入以下命令运行文件:

python predict.py
# [{\'left\': 684.79376, \'right\': 2024.4724, \'top\': 961.53644, \'bottom\': 2299.855, \'label\': \'cat\', \'confidence\': 0.94765514}, {\'left\': 1461.0829, \'right\': 3853.3633, \'top\': 621.53064, \'bottom\': 2769.5376, \'label\': \'cat\', \'confidence\': 0.8093604}]

可以看到，识别到了两只猫，其中第一只猫顶部位置为961，右部位置为2024，左部位置为684，底部位置为2299。根据这个位置，编写代码，用于框出相应位置的猫：

def paint_rect(input_img: str, output_path: str,
               labels: list, position: list):
    \"\"\"
    画出矩形
        :param input_img: 输入图片
        :param output_path: 输出图片
        :param labels: 标签
        :param positions: 坐标
    公众号：Python实用宝典
    \"\"\"
    img = cv2.imread(input_img)

    for position in positions:
        print(position)
        # 画矩形框, 输入参数分别为图像、左上角坐标、右下角坐标、颜色数组、粗细
        cv2.rectangle(
            img, (position[\'left\'], position[\'top\']),
            (position[\'right\'], position[\'bottom\']),
            (0, 255, 0), thickness=10
        )

    if \'cat\' in labels:
        # 若是猫，则存到另一个地方
        shutil.move(input_img, output_path + os.sep + input_img.split(\'/\')[-1])
        cv2.imwrite(output_path + os.sep + \'rect_%s\' % input_img.split(\'/\')[-1], img)

效果如下：

3.批量自动识别

这样，我们就有思路进行自动识别了，首先获得该文件夹下所有的图片，其次，将这些图片都放入分类器中进行分类，最后，再根据分类的标签将其提取出来移动到其他地方。

获得该文件夹下所有图片：

def get_all_path(dirpath, *suffix):
    \"\"\"
    获得所有路径

    @param dirpath: 目录
    @param *suffix: 后缀
    公众号：Python实用宝典
    \"\"\"

    path_array = []
    for r, ds, fs in os.walk(dirpath):
        for fn in fs:
            if os.path.splitext(fn)[1] in suffix:
                fname = os.path.join(r, fn)
                path_array.append(fname)
    return path_array
# 获得所有jpg和png图片
image_paths = get_all_path(source_path, \'.jpg\', \'.JPG\', \'png\', \'PNG\')

放入分类器中分类：

# 加载模型
yolov3 = hub.Module(name=\"yolov3_darknet53_coco2017\")
# 输入图片
input_dict = {\"image\": image_paths}
# 输出结果
results = yolov3.object_detection(data=input_dict, labels=[\'cat\'])

根据标签画框并移动：

def paint_rect(input_img: str, output_path: str,
               labels: list, position: list):
    \"\"\"
    画出矩形
        :param input_img: 输入图片
        :param output_path: 输出图片
        :param labels: 标签
        :param positions: 坐标
    公众号：Python实用宝典
    \"\"\"
    img = cv2.imread(input_img)

    for position in positions:
        # 画矩形框, 输入参数分别为图像、左上角坐标、右下角坐标、颜色数组、粗细
        cv2.rectangle(
            img, (position[\'left\'], position[\'top\']),
            (position[\'right\'], position[\'bottom\']),
            (0, 255, 0), thickness=10
        )

    if \'cat\' in labels:
        # 若是猫，则存到另一个地方
        shutil.move(input_img, output_path + os.sep + input_img.split(\'/\')[-1])
        cv2.imwrite(output_path + os.sep + \'rect_%s\' % input_img.split(\'/\')[-1], img)

results = yolov3.object_detection(data=input_dict, labels=[\'cat\'])
for result in results:
    path = result[\'path\']
    labels = []
    positions = []
    for target in result[\'data\']:
        labels.append(target.get(\'label\', \'\'))
        positions.append({
            \'left\': target.get(\'left\', -1),
            \'top\': target.get(\'top\', -1),
            \'right\': target.get(\'right\', -1),
            \'bottom\': target.get(\'bottom\', -1)
        })
    paint_rect(path, target_path, labels, positions)

4.完整代码

import paddlehub as hub
import cv2
import os
import shutil
 
 
def get_all_path(dirpath, *suffix):
    \"\"\"
    获得所有路径
 
    @param dirpath: 目录
    @param *suffix: 后缀
    \"\"\"
 
    path_array = []
    for r, ds, fs in os.walk(dirpath):
        for fn in fs:
            if os.path.splitext(fn)[1] in suffix:
                fname = os.path.join(r, fn)
                path_array.append(fname)
    return path_array
 
 
def paint_rect(input_img: str, output_path: str,
               labels: list, position: list):
    \"\"\"
    画出矩形
        :param input_img: 输入图片
        :param output_path: 输出图片
        :param labels: 标签
        :param positions: 坐标
    \"\"\"
    img = cv2.imread(input_img)
 
    for position in positions:
        # 画矩形框, 输入参数分别为图像、左上角坐标、右下角坐标、颜色数组、粗细
        cv2.rectangle(
            img, (position[\'left\'], position[\'top\']),
            (position[\'right\'], position[\'bottom\']),
            (0, 255, 0), thickness=10
        )
 
    if \'cat\' in labels:
        # 若是猫，则存到另一个地方
        shutil.move(input_img, output_path + os.sep + input_img.split(\'/\')[-1])
        cv2.imwrite(output_path + os.sep + \'rect_%s\' % input_img.split(\'/\')[-1], img)
 
 
if __name__ == \'__main__\':
    source_path = \'./imgs/\'
    target_path = \'./target/\'
 
    # 获得所有jpg和png图片
    image_paths = get_all_path(source_path, \'.jpg\', \'.JPG\', \'png\', \'PNG\')
 
    # 加载模型
    yolov3 = hub.Module(name=\"yolov3_darknet53_coco2017\")
 
    # 输入图片
    input_dict = {\"image\": image_paths}
 
    # 输出结果
    results = yolov3.object_detection(data=input_dict, labels=[\'cat\'])
    for result in results:
        path = result[\'path\']
        labels = []
        positions = []
        print(path)
        for target in result[\'data\']:
            labels.append(target.get(\'label\', \'\'))
            positions.append({
                \'left\': target.get(\'left\', -1),
                \'top\': target.get(\'top\', -1),
                \'right\': target.get(\'right\', -1),
                \'bottom\': target.get(\'bottom\', -1)
            })
        paint_rect(path, target_path, labels, positions)

版权声明 1 本网站名称：偶像资源网
2 本站永久网址：https://www.ox520.com
3 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长 QQ593098775进行删除处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6 本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END

基于Python实现一键找出磁盘里所有猫照

目录

前言

1.准备

2.编写代码

3.批量自动识别

4.完整代码

请登录后发表评论