首页 > 编程语言 >深度学习基础与实战:Python实现

深度学习基础与实战:Python实现

时间:2024-07-11 22:29:03浏览次数:14  
标签:实战 layers keras Python self train 深度 tf model

深度学习基础与实战:Python实现

深度学习是机器学习的一个重要分支,通过多层神经网络实现对数据的自动特征提取和建模。本文将介绍深度学习的基础概念、常用框架以及一个完整的实战项目,帮助读者从基础入门到实际应用。

目录

  1. 深度学习概述
  2. 深度学习基础
    • 神经网络结构
    • 前向传播与反向传播
    • 激活函数
  3. Python中的深度学习框架
    • TensorFlow
    • Keras
    • PyTorch
  4. 深度学习模型
    • 简单神经网络
    • 卷积神经网络
    • 循环神经网络
  5. 实战项目:手写数字识别
  6. 总结

1. 深度学习概述

深度学习通过模拟人脑的神经网络结构来进行数据处理和模式识别,广泛应用于图像识别、自然语言处理和语音识别等领域。深度学习模型通过多层神经元的非线性变换,逐层提取数据的特征,实现复杂的模式识别和决策。

2. 深度学习基础

神经网络结构

神经网络由多个层(输入层、隐藏层和输出层)组成,每一层包含若干个神经元。神经元之间通过权重相连,权重的调整使得神经网络能够学习和预测。

import numpy as np

# 定义一个简单的神经网络
class SimpleNN:
    def __init__(self, input_size, hidden_size, output_size):
        self.W1 = np.random.randn(input_size, hidden_size)
        self.W2 = np.random.randn(hidden_size, output_size)
    
    def forward(self, X):
        self.z1 = np.dot(X, self.W1)
        self.a1 = self.sigmoid(self.z1)
        self.z2 = np.dot(self.a1, self.W2)
        self.a2 = self.sigmoid(self.z2)
        return self.a2
    
    def sigmoid(self, s):
        return 1 / (1 + np.exp(-s))
    
    def sigmoid_derivative(self, s):
        return s * (1 - s)
前向传播与反向传播

前向传播是计算神经网络输出的过程,反向传播则是通过计算损失函数的梯度来更新权重。

class SimpleNN:
    # ... previous code ...
    
    def backward(self, X, y, output):
        self.output_error = y - output
        self.output_delta = self.output_error * self.sigmoid_derivative(output)
        
        self.z1_error = self.output_delta.dot(self.W2.T)
        self.z1_delta = self.z1_error * self.sigmoid_derivative(self.a1)
        
        self.W1 += X.T.dot(self.z1_delta)
        self.W2 += self.a1.T.dot(self.output_delta)
激活函数

激活函数用于引入非线性特性,使得神经网络可以拟合复杂的函数。常用的激活函数包括Sigmoid、ReLU和Tanh。

import matplotlib.pyplot as plt

x = np.linspace(-10, 10, 100)
sigmoid = 1 / (1 + np.exp(-x))
relu = np.maximum(0, x)
tanh = np.tanh(x)

plt.figure(figsize=(10, 6))
plt.plot(x, sigmoid, label='Sigmoid')
plt.plot(x, relu, label='ReLU')
plt.plot(x, tanh, label='Tanh')
plt.legend()
plt.show()

3. Python中的深度学习框架

Python中有许多强大的深度学习框架,这些框架提供了丰富的工具和接口,方便我们进行深度学习模型的构建和训练。

TensorFlow

TensorFlow是由Google开发的开源深度学习框架,支持大规模分布式计算。

import tensorflow as tf

# 定义一个简单的全连接层
model = tf.keras.Sequential([
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

# 编译模型
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

# 训练模型
model.fit(X_train, y_train, epochs=10)
Keras

Keras是一个高级深度学习API,能够运行在TensorFlow、Theano和CNTK之上,具有简洁和易用的特点。

from keras.models import Sequential
from keras.layers import Dense

# 定义一个简单的神经网络
model = Sequential([
    Dense(64, input_dim=20, activation='relu'),
    Dense(10, activation='softmax')
])

# 编译模型
model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# 训练模型
model.fit(X_train, y_train, epochs=10, batch_size=32)
PyTorch

PyTorch是由Facebook开发的深度学习框架,支持动态图计算,灵活性高。

import torch
import torch.nn as nn
import torch.optim as optim

# 定义一个简单的神经网络
class SimpleNN(nn.Module):
    def __init__(self):
        super(SimpleNN, self).__init__()
        self.fc1 = nn.Linear(20, 64)
        self.fc2 = nn.Linear(64, 10)
    
    def forward(self, x):
        x = torch.relu(self.fc1(x))
        x = torch.softmax(self.fc2(x), dim=1)
        return x

model = SimpleNN()
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 训练模型
for epoch in range(10):
    outputs = model(X_train)
    loss = criterion(outputs, y_train)
    
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

4. 深度学习模型

简单神经网络

简单神经网络包含一个或多个隐藏层,每个隐藏层包含若干个神经元。

import tensorflow as tf

model = tf.keras.Sequential([
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(32, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=10)
卷积神经网络

卷积神经网络(CNN)擅长处理图像数据,通过卷积层和池化层提取图像特征。

import tensorflow as tf

model = tf.keras.Sequential([
    tf.keras.layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    tf.keras.layers.MaxPooling2D((2, 2)),
    tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),
    tf.keras.layers.MaxPooling2D((2, 2)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=10)
循环神经网络

循环神经网络(RNN)擅长处理序列数据,通过循环结构捕捉数据的时间依赖性。

import tensorflow as tf

model = tf.keras.Sequential([
    tf.keras.layers.Embedding(input_dim=10000, output_dim=64),
    tf.keras.layers.SimpleRNN(128),
    tf.keras.layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=10)

5. 实战项目:手写数字识别

我们将使用MNIST数据集进行手写数字识别任务,结合前述技术,进行完整的实现。

数据导入与预处理
import tensorflow as tf

# 加载数据
mnist = tf.keras.datasets.mnist
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# 数据归一化
X_train, X_test = X_train / 255.0, X_test / 255.0

# 增加通道维度
X_train = X_train[..., tf.newaxis]
X_test = X_test[..., tf.newaxis]
模型构建与训练
model = tf.keras.Sequential([
    tf.keras.layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    tf.keras.layers.MaxPooling2D((2, 2)),
    tf.keras.layers.Conv2D(64, (3, 3), activation='relu'),
    tf.keras.layers.MaxPooling2D((2, 2)),
    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(64, activation='relu'),


    tf.keras.layers.Dense(10, activation='softmax')
])

model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(X_train, y_train, epochs=5, validation_data=(X_test, y_test))
模型评估
# 模型评估
loss, accuracy = model.evaluate(X_test, y_test)
print(f'Accuracy: {accuracy}')

# 可视化预测结果
import matplotlib.pyplot as plt
import numpy as np

# 预测
predictions = model.predict(X_test)

# 绘制前10个测试样本及其预测结果
for i in range(10):
    plt.subplot(2, 5, i+1)
    plt.imshow(X_test[i].reshape(28, 28), cmap='gray')
    plt.title(f'Pred: {np.argmax(predictions[i])}, True: {y_test[i]}')
    plt.axis('off')
plt.show()

6. 总结

本文详细介绍了深度学习的基础概念、常用框架、深度学习模型以及一个完整的实战项目。通过本文的学习,读者可以掌握深度学习的基础知识和技术,并能在实际项目中应用这些知识进行模型构建和训练。

标签:实战,layers,keras,Python,self,train,深度,tf,model
From: https://blog.csdn.net/u010986241/article/details/140353454

相关文章

  • 认识python字典
    一、字典的定义        字典是Python中的一种数据结构,它可以存储键值对(key-valuepair)。每个键(key)都是唯一的,并且与它相关联的是一个值(value)。字典是无序的,可以根据键来访问和修改其中的值。字典使用花括号{}来定义,并使用冒号 : 来分隔键和值,每个键值对之间使......
  • python+flask计算机毕业设计民宿网站(程序+开题+论文)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着旅游业的蓬勃发展,民宿作为一种新兴住宿方式,凭借其独特的体验、个性化的服务和相对亲民的价格,逐渐成为现代旅行者青睐的选择。然而,面对......
  • python+flask计算机毕业设计基于B_S架构的社区租户管理系统(程序+开题+论文)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着城市化进程的加速和房地产市场的蓬勃发展,社区管理成为了城市治理中不可或缺的一环。特别是在租赁市场日益活跃的背景下,传统的社区管理......
  • 高盛开源的量化金融 Python 库
    GSQuantGSQuant是用于量化金融的Python工具包,建立在世界上最强大的风险转移平台之一之上。旨在加速量化交易策略和风险管理解决方案的开发,凭借25年的全球市场经验精心打造。它由高盛的定量开发人员(定量)创建和维护,以支持交易策略的开发和衍生产品的分析。GSQuant可用于......
  • 《0基础》轻松学会Python——第五讲
    第五讲一、转义字符(\n,\t,\',\\,\r)    1、\n :表示换行符print('人生若只如初见,何事秋风悲画扇')print('*'*50)print('人生若只如初见,\n何事秋风悲画扇')        2、\t  :制表符,即tab键print('人生而自由,却无往不在枷锁中')print('人生而自由,却无......
  • Python 爬虫与 Java 爬虫:相似之处、不同之处和选项
    在信息时代,网络上可用的数据量巨大且不断增长。为了从这些数据中提取有用的信息,爬虫已成为一种重要的技术。Python和Java都是流行的编程语言,都具有强大的爬虫功能。本文将深入探讨Python爬虫和Java爬虫之间的差异,以帮助您在选择适合您需求的语言时做出明智的决定。一......
  • 派森学长带你学python—字符串
    一.字符串(1)字符串数据类型和整型、浮点型都是python中的不可变数据类型接下来我们将学习:字符串的三种界定符号、转义字符和原字符。'''字符串、整型、浮点型都是不可变数据'''name='marry'address="北京朝阳"favor='''游泳,篮球,羽毛球,赛车'''print(name)print(add......
  • 持续基础怎么搞?Jenkins+Docker+Git实战
     在如今的互联网时代,随着软件开发复杂度的不断提高,软件开发和发布管理也越来越重要。目前已经形成一套标准的流程,最重要的组成部分就是持续集成(ContinuousIntegration,CI)及持续部署、交付(CD)。在此,我们来以一个案例初步了解CI流程。那么什么是CI呢?简单来讲,CI就是将......
  • python的选择循环结构
    Python中的选择循环结构是编程中非常基本且强大的部分,它们允许程序根据条件执行不同的代码块。Python中主要有两种选择结构(条件语句)和一种循环结构。选择结构(条件语句)if语句if语句执行是从上往下判断,如果在某个判断上是True,把该判断对应的语句执行后,剩余部分会被忽略。这里......
  • 【少儿编程Python:趣味编程,探索未来】第四章 面向对象编程,开启编程新境界 / 第一节 类
    欢迎进入Python编程的奇幻世界!在这个课程中,我们将一起探索编程的乐趣,通过生动有趣的方式,培养孩子们的逻辑思维和创造力,让他们成为未来的科技小达人。以下是我们课程的大纲:【少儿编程Python:趣味编程,探索未来】目录1.面向对象1.1面向对象的定义1.2面向对象的......