首页 > 编程语言 >Python机器学习——识别不同鸟类

Python机器学习——识别不同鸟类

时间:2023-06-06 18:56:50浏览次数:50  
标签:layers plt 鸟类 keras Python tf import 识别 size

(一)选题背景:

  鸟类是野生动物的重要组成部分,是自然界的一项重要资源动物,也是生态系统中的重要组成部分。鸟类是可更新的自然资源,它在商业、旅游、美学、文化、科学和生态上都有重要价值。国内近年来鸟类系统发育与分类、分布的研究不断取得新的成果,这些对于研究我国的鸟类分类区系和系统发育、地理分布以及 生物多样性保护,都能提供很有价值的信息。机器人如何来识别不同的鸟类,由此设计了一套程序来识别不同的鸟类物种

(二)机器学习设计案例:

  从网站中下载相关的数据集,对数据集进行整理,在python的环境中,给数据集中的文件打上标签,"train"和 "test"文件用于训练和测试,对数据进行预处理,利用keras和tensorflow,通过构建输入层,隐藏层,输出层建立训练模型,导入图片测试模型。

数据集来源:kaggle,网址:https://www.kaggle.com/

(三)机器学习的实现步骤

1.数据集下载

 

 

 2.导入需要用到的库

import numpy as np
import pandas as pd
import os
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator, load_img, img_to_array #从数据库里导入所需函数
from tensorflow.keras.models import Sequential, Model
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Dense, GlobalAveragePooling2D, Dropout, Flatten
from tensorflow.keras.applications import VGG16
import matplotlib.pyplot as plt
import seaborn as sns

train_ds="./lty/bird-species/train"#设置训练集所在的路径
test_ds="./lty/bird-species/test"#设置测试集所在的路径
validation_ds="./lty/bird-species/valid"#设置验证集所在路径

3.遍历得到train的目录下的文件

path="C:/Users/z/lty/bird-species/train"
dirs = os.listdir( path )#返回train训练集文件夹列表
for file in dirs:
print (file)

IMAGE_DIM = (224,224)#设置图片尺寸
BATCH_SIZE = 32 #设置batch数据为32
CLASSES = 525

 4.得到每个文件中图片的数量并进行图像预处理

train_datagen = ImageDataGenerator(rescale=1./255,
width_shift_range=0.2,
height_shift_range=0.2,
zoom_range=0.2
)

val_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(directory="./lty/bird-species/train",
target_size=IMAGE_DIM, #图像尺寸224*224
batch_size=BATCH_SIZE, #batch数据,默认大小32
class_mode='categorical', #设置参数
shuffle=True )

validation_generator = val_datagen.flow_from_directory(directory="./lty/bird-species/valid",
target_size=IMAGE_DIM,
batch_size=BATCH_SIZE,
class_mode='categorical',
shuffle=False ) #不混洗数据

 5.可视化训练数据的一批数据,并查看经过处理的图片以及它的标签

labels = [k for k in train_generator.class_indices]
sample_generate = train_generator.__next__()

images = sample_generate[0]
titles = sample_generate[1]
plt.figure(figsize = (15 , 15))

#创建一个子图矩阵

for i in range(20):
plt.subplot(5 , 5 , i+1)
plt.subplots_adjust(hspace = 0.3 , wspace = 0.3)
plt.imshow(images[i])
plt.suptitle("Sample Training Images", fontsize=20)
plt.title(f'Class: {labels[np.argmax(titles[i],axis=0)]}')
plt.axis("off")

8.构建神经网络并对模型进行训练

import numpy as np
from keras.layers import Dense,Flatten,Conv2D,Activation,Dropout

from keras import backend as K

import keras

from keras.models import Sequential, Model

from keras.models import load_model

from keras.optimizers import SGD

from keras.callbacks import EarlyStopping,ModelCheckpoint

from keras.layers import MaxPool2D

from keras.layers import Dense

from keras.optimizers import Adam

#构建模型,
model = tf.keras.models.Sequential([
tf.keras.layers.Conv2D(input_shape=(224,224,3),filters=64,kernel_size=(3,3),padding="same", activation="relu"),
tf.keras.layers.Conv2D(filters=64,kernel_size=(3,3),padding="same", activation="relu"),
tf.keras.layers.MaxPooling2D(pool_size=(2,2),strides=(2,2)),
tf.keras.layers.Conv2D(filters=128, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.Conv2D(filters=128, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.MaxPooling2D(pool_size=(2,2),strides=(2,2)),
tf.keras.layers.Conv2D(filters=256, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.Conv2D(filters=256, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.MaxPooling2D(pool_size=(2,2),strides=(2,2)),
tf.keras.layers.Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.MaxPooling2D(pool_size=(2,2),strides=(2,2)),
tf.keras.layers.Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.MaxPooling2D(pool_size=(2,2),strides=(2,2)),


#将输入层的数据压成一维的数据

tf.keras.layers.Flatten(),
tf.keras.layers.Dense(units=4096,activation="relu"),
tf.keras.layers.Dense(units=4096,activation="relu"),
tf.keras.layers.Dense(units=525, activation="softmax")

])

# 模型编译
model.compile(optimizer=opt,
loss=keras.losses.categorical_crossentropy,
metrics=['accuracy'])

9.总结模型

#输出模型各层的参数状况

model.summary()

 

from keras.optimizers import Adam

optimizer_Adam= Adam(lr=0.00001)#优化器

#利用批量生成器训练模型
history =model.fit(train_generator,
epochs=15,
validation_data=test_generator
)

 

#保存模型

9.绘制损失曲线和精度曲线图

#绘制损失曲线
plt.figure(figsize=(12,5))
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('Model Loss')
plt.ylabel('loss')
plt.xlabel('Epochs')
plt.legend(['Train','Val'], loc= 'upper right')
plt.show()

 

#绘制精度曲线图
plt.figure(figsize=(12,5))
plt.plot(history.history['accuracy'])
plt.plot(history.history['val_accuracy'])
plt.title('Model Accuracy')
plt.ylabel('Accuracy')
plt.xlabel('Epochs')
plt.legend(['Train','Val'], loc = 'lower right')
plt.show()

test_datagen = ImageDataGenerator(rescale=1./255)

test_generator = test_datagen.flow_from_directory(directory="./lty/bird-species/test",
target_size=IMAGE_DIM,
batch_size=BATCH_SIZE,
class_mode='categorical',
shuffle=False )

10.测试模型

#对测试集的分类性能进行评估,及输出分类

y_test_1 = test_generator.classes #将测试集的样本标签存储到y_test_1
y_pred_1 =model.predict(test_generator) #预测结果存到y_pred_1 
y_pred_1 = np.argmax(y_pred_1,axis=1)

 results =model.evaluate(test_generator)

 

#鸟类分类报告

from sklearn.metrics import classification_report #引用库,用于输出分类报告

print(classification_report(y_test_1, y_pred_1))

 

11.鸟类分类预测类别

#循环遍历预测结果,

for i in range(len(images)):
predicted_class = np.argmax(predictions[i])
class_probability = predictions[i, predicted_class]
print(f'Predicted class for {i+1}.jpg : {labels[predicted_class]}') #输出预测结果
print('Class probability:', class_probability) #输出预测结果对应的概率

#输出单张图片的预测结果,包括预测类别和置信度

from PIL import Image
import os
import numpy as np
import matplotlib.pyplot as plt

image_directory = './lty/bird-species/valid/AMERICAN BITTERN'
IMAGE_DIM=( 224,224)

images = [ ]
for filename in os.listdir(image_directory):
path = os.path.join(image_directory, filename)
img = Image.open(path)
img = img.resize(IMAGE_DIM)
images.append(img)

images = np.array([np.array(img) for img in images])
images = images / 255.0

predictions = model.predict(images)

img_index = 0

class_label = np.argmax(predictions[img_index])#获取预测结果存于class_label

plt.imshow(images[img_index])
plt.axis('off')
plt.title('Predicted class: ' + str(class_label)) #预测类别
plt.show()

 

(四)收获:

  本次的程序设计主要内容是机器学习,通过本次课程设计,让我对机器学习的理解更加深刻,同时,使我掌握了如何进行机器学习,导入数据并查看数据,构建数据集。学会了如何利用卷积层神经网络进行鸟类识别,使用Keras框架和Tensorflow库构建模型 (Adam优化器加快模型训练,)利用EarlyStopping和ModelCheckpoint回调函数来提高模型的性能,以及使用图像分类的机器学习程序。

 

(五)全代码

import numpy as np
import pandas as pd
import os
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator, load_img, img_to_array #从数据库里导入所需函数
from tensorflow.keras.models import Sequential, Model
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Dense, GlobalAveragePooling2D, Dropout, Flatten
from tensorflow.keras.applications import VGG16
import matplotlib.pyplot as plt
import seaborn as sns

train_ds="./lty/bird-species/train"#设置训练集所在的路径
test_ds="./lty/bird-species/test"#设置测试集所在的路径
validation_ds="./lty/bird-species/valid"#设置验证集所在路径

path="C:/Users/z/lty/bird-species/train"
dirs = os.listdir( path )#返回train训练集文件夹列表
for file in dirs:
print (file)
IMAGE_DIM = (224,224)#设置图片尺寸
BATCH_SIZE = 32 #设置batch数据为32
CLASSES = 525

train_datagen = ImageDataGenerator(rescale=1./255,
width_shift_range=0.2,
height_shift_range=0.2,
zoom_range=0.2
)

val_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(directory="./lty/bird-species/train",
target_size=IMAGE_DIM, #图像尺寸224*224
batch_size=BATCH_SIZE, #batch数据,默认大小32
class_mode='categorical', #设置参数
shuffle=True )

validation_generator = val_datagen.flow_from_directory(directory="./lty/bird-species/valid",
target_size=IMAGE_DIM,
batch_size=BATCH_SIZE,
class_mode='categorical',
shuffle=False ) #不混洗数据

labels = [k for k in train_generator.class_indices]
sample_generate = train_generator.__next__()

images = sample_generate[0]
titles = sample_generate[1]
plt.figure(figsize = (15 , 15))

#创建一个子图矩阵
for i in range(20):
plt.subplot(5 , 5 , i+1)
plt.subplots_adjust(hspace = 0.3 , wspace = 0.3)
plt.imshow(images[i])
plt.suptitle("Sample Training Images", fontsize=20)
plt.title(f'Class: {labels[np.argmax(titles[i],axis=0)]}')
plt.axis("off")

import numpy as np
from keras.layers import Dense,Flatten,Conv2D,Activation,Dropout
from keras import backend as K
import keras
from keras.models import Sequential, Model
from keras.models import load_model
from keras.optimizers import SGD
from keras.callbacks import EarlyStopping,ModelCheckpoint
from keras.layers import MaxPool2D
from keras.layers import Dense
from keras.optimizers import Adam
#构建模型,
model = tf.keras.models.Sequential([
tf.keras.layers.Conv2D(input_shape=(224,224,3),filters=64,kernel_size=(3,3),padding="same", activation="relu"),
tf.keras.layers.Conv2D(filters=64,kernel_size=(3,3),padding="same", activation="relu"),
tf.keras.layers.MaxPooling2D(pool_size=(2,2),strides=(2,2)),
tf.keras.layers.Conv2D(filters=128, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.Conv2D(filters=128, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.MaxPooling2D(pool_size=(2,2),strides=(2,2)),
tf.keras.layers.Conv2D(filters=256, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.Conv2D(filters=256, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.MaxPooling2D(pool_size=(2,2),strides=(2,2)),
tf.keras.layers.Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.MaxPooling2D(pool_size=(2,2),strides=(2,2)),
tf.keras.layers.Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.Conv2D(filters=512, kernel_size=(3,3), padding="same", activation="relu"),
tf.keras.layers.MaxPooling2D(pool_size=(2,2),strides=(2,2)),
#将输入层的数据压成一维的数据
tf.keras.layers.Flatten(),
tf.keras.layers.Dense(units=4096,activation="relu"),
tf.keras.layers.Dense(units=4096,activation="relu"),
tf.keras.layers.Dense(units=525, activation="softmax")
])

# 模型编译
model.compile(optimizer=opt,
loss=keras.losses.categorical_crossentropy,
metrics=['accuracy'])

#输出模型各层的参数状况
model.summary()

from keras.optimizers import Adam
optimizer_Adam= Adam(lr=0.00001)#优化器

#利用批量生成器训练模型
history =model.fit(train_generator,
epochs=15,
validation_data=test_generator
)

#绘制损失曲线
plt.figure(figsize=(12,5))
plt.plot(history.history['loss'])
plt.plot(history.history['val_loss'])
plt.title('Model Loss')
plt.ylabel('loss')
plt.xlabel('Epochs')
plt.legend(['Train','Val'], loc= 'upper right')
plt.show()

#绘制精度曲线图
plt.figure(figsize=(12,5))
plt.plot(history.history['accuracy'])
plt.plot(history.history['val_accuracy'])
plt.title('Model Accuracy')
plt.ylabel('Accuracy')
plt.xlabel('Epochs')
plt.legend(['Train','Val'], loc = 'lower right')
plt.show()

test_datagen = ImageDataGenerator(rescale=1./255)
test_generator = test_datagen.flow_from_directory(directory="./lty/bird-species/test",
target_size=IMAGE_DIM,
batch_size=BATCH_SIZE,
class_mode='categorical',
shuffle=False )

#对测试集的分类性能进行评估,及输出分类
y_test_1 = test_generator.classes #将测试集的样本标签存储到y_test_1
y_pred_1 =model.predict(test_generator) #预测结果存到y_pred_1
y_pred_1 = np.argmax(y_pred_1,axis=1)
results =model.evaluate(test_generator)

from sklearn.metrics import classification_report #引用库,用于输出分类报告
print(classification_report(y_test_1, y_pred_1))

for i in range(len(images)):
predicted_class = np.argmax(predictions[i])
class_probability = predictions[i, predicted_class]
print(f'Predicted class for {i+1}.jpg : {labels[predicted_class]}') #输出预测结果
print('Class probability:', class_probability) #输出预测结果对应的概率

#输出单张图片的预测结果,包括预测类别和置信度

from PIL import Image
import os
import numpy as np
import matplotlib.pyplot as plt

image_directory = './lty/bird-species/valid/AMERICAN BITTERN'
IMAGE_DIM=( 224,224)

images = [ ]
for filename in os.listdir(image_directory):
path = os.path.join(image_directory, filename)
img = Image.open(path)
img = img.resize(IMAGE_DIM)
images.append(img)

images = np.array([np.array(img) for img in images])
images = images / 255.0

predictions = model.predict(images)

img_index = 0

class_label = np.argmax(predictions[img_index])#获取预测结果存于class_label
plt.imshow(images[img_index])
plt.axis('off')
plt.title('Predicted class: ' + str(class_label)) #预测类别
plt.show()

 

标签:layers,plt,鸟类,keras,Python,tf,import,识别,size
From: https://www.cnblogs.com/ketolty/p/17461435.html

相关文章

  • Python 练手小项目-名片管理
    需求描述需要写一段程序实现简单名片管理功能程序启动展示主界面新建名片显示全部查询名片退出系统主程序实现'''名片管理系统主程序'''importcards_toolswhileTrue:'''显示主界面'''cards_tools.show_menu()action=input('请选择操作功能:�......
  • python打包后,执行报错:NameError: name ‘exit‘ is not defined
    try:file_name=os.path.basename(src)file_size=os.stat(src).st_sizeexceptException:print("源文件不存在:",src)exit()在ide使用中没有问题,但是封装成应用程序时就出现问题: NameError:name'exit'isnotdef......
  • Python 中 yeild 的用法
    本文包含以下四部分:yeild介绍yeild案例简单的例子对比yeild和常规函数复杂的例子说明yeild与普通函数的差异1.yeild介绍yield是Python的一个关键字,用于从一个函数中返回一个生成器(generator)。生成器是一种特殊类型的迭代器,它允许你延迟计算结果,这在处理大数据或......
  • CentOS 6.9 python3.10 numpy 安装使用 - gcc 升级
    踩坑记录程序写好了,使用了pandas,放在服务器上,运行报错:Originalerrorwas:/lib64/libgcc_s.so.1:version`GCC_4.8.0'notfound(requiredby/usr/local/lib/python3.10/site-packages/numpy/core/../../numpy.libs/libgfortran-040039e1.so.5.0.0)可以看到是导入numpy......
  • Python Django Xadmin 的使用
    笔者Python版本为3.10.6,Django版本为4.2.2本项目代码已开源,可到GitHub仓库中查看本项目用到的xadmin、DjangoUeditor文件夹笔者已经按照Python3.10版本进行了修改,点击链接即可下载。但如果你使用的Python版本较低,可能会因此出现一些BUG,请到问题汇总查看,如果......
  • python切片详解
    索引的一般方式一个完整的切片是包含三个参数和两个冒号":",用于分隔三个参数(start_index、end_index、step)。当只有一个“:”时,默认第三个参数step=1;当一个“:”也没有时,start_index=end_index,表示切取start_index指定的那个元素。切片操作的基本表达式:object[start......
  • 【理论积累】Python中的Pandas库【一】
    Pandas库介绍Pandas是一个用于数据分析的Python第三方库,能够处理和分析不同格式的数据,例如:CSV、Excel、SQL数据库等。Pandas提供了两种数据结构,分别为Series和DataFrame,灵活而方便地进行数据分析和操作。以下是Pandas的核心概念和功能:Series:类似于NumPy的ndarra......
  • Python 多进程之间共享变量
    原文地址:https://blog.51cto.com/alwaysbeta/5162851Python多线程之间共享变量很简单,直接定义全局global变量即可。而多进程之间是相互独立的执行单元,这种方法就不可行了。不过Python标准库已经给我们提供了这样的能力,使用起来也很简单。但要分两种情况来看,一种是Process......
  • Python tkinter 树形列表控件(Treeview)的使用简单举例,建立一个treeview
     importtkinterastkfromtkinter.ttkimportTreeview#创建tkinter应用程序窗口root=tk.Tk()#设置窗口大小和位置root.geometry('500x300+400+300')#不允许改变窗口大小root.resizable(False,False)#设置窗口标题root.title('通信录管理系统')#使用Tree......
  • 实验6 turtle绘图和Python库应用编程体验
    实验任务1task1_1.py源代码1fromturtleimport*23defmove(x,y):4penup()5goto(x,y)6pendown()78defdraw(n,size=100):9foriinrange(n):10fd(size)11left(360/n)1213defmain():14pensize(2)1......