循环神经网络（RNN）是一类专门处理_老汪软件技巧-棋牌游戏开发

作者：老汪软件技巧
发表时间：2024-11-27 04:01
浏览量：112

前情提要：后端开发自学AI知识，内容比较浅显，偏实战；仅适用于入门了解，解决日常沟通障碍。

循环神经网络（RNN）是一类专门处理序列数据的神经网络模型，适用于时间序列、文本、音频等具有顺序性的数据。RNN的核心特性是其循环结构，使得它能够利用输入的上下文信息。

1. RNN 的核心思想

RNN 的特殊之处在于它的隐藏层具有记忆能力。在处理当前输入时，它会结合当前输入与前一时刻隐藏层的状态，从而使得网络具有一定的“记忆”能力。

2. 特性循环结构：隐藏层的输出被反馈到自己，用于下一个时间步的计算。适用序列：可以处理变长的输入序列，如时间序列、自然语言句子等。共享权重：时间步间的参数是共享的，使得模型更易于训练和推广。3. RNN 的应用场景

时间序列数据：

语音和音频处理：

视频处理：

4. RNN 的局限性

梯度消失和梯度爆炸：

长时依赖难以捕获：

5. 改进版本LSTM (Long Short-Term Memory) ：GRU (Gated Recurrent Unit) ：LSTM（Long Short-Term Memory）概述

LSTM（长短期记忆网络）是一种特殊的递归神经网络（RNN），专为处理和预测时间序列数据或具有长期依赖关系的问题而设计。相比传统 RNN，LSTM 能更好地捕获长期依赖，解决了 RNN 的梯度消失或梯度爆炸问题。

1. LSTM 的核心结构

LSTM 的基本结构包括以下部分：

记忆单元（Cell State）：

门机制（Gate Mechanisms）：

2. LSTM 的工作原理

3. LSTM 的特点案例：电影评论情感分类

目标：构建一个文本分类模型，将 IMDb 数据集中每条电影评论分类为正面或负面。

IMDB 数据集内置于 TensorFlow 中，无需额外下载。如果需要离线使用，可以从 IMDb 官方页面获取。每条评论已标注为正面（1）或负面（0），数据格式为纯文本。

特点：

步骤1. 数据加载

我们将使用 TensorFlow 提供的 IMDb 数据集：

import tensorflow as tf
from tensorflow.keras.datasets import imdb
from tensorflow.keras.preprocessing.sequence import pad_sequences
# 加载 IMDb 数据集
vocab_size = 10000  # 仅保留最常用的 10000 个单词
(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=vocab_size)
# 数据预处理：填充序列
max_len = 200  # 限定序列的最大长度
x_train = pad_sequences(x_train, maxlen=max_len, padding='post')
x_test = pad_sequences(x_test, maxlen=max_len, padding='post')

2. 构建模型

使用嵌入层 (Embedding) 和 LSTM 处理文本数据。

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense
# 模型构建
model = Sequential([
    Embedding(input_dim=vocab_size, output_dim=64, input_length=max_len),
    LSTM(64, return_sequences=False),
    Dense(1, activation='sigmoid')  # 二分类问题
])
# 编译模型
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

3. 模型训练

# 训练模型
history = model.fit(
    x_train, y_train,
    epochs=5,
    batch_size=64,
    validation_split=0.2
)

4. 模型评估

# 测试模型
loss, accuracy = model.evaluate(x_test, y_test)
print(f"测试集准确率: {accuracy * 100:.2f}%")

可视化结果

绘制训练和验证的损失、准确率曲线：

import matplotlib.pyplot as plt
# 绘制损失曲线
plt.figure(figsize=(12, 5))
plt.subplot(1, 2, 1)
plt.plot(history.history['loss'], label='Training Loss')
plt.plot(history.history['val_loss'], label='Validation Loss')
plt.title('Loss Curve')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()
# 绘制准确率曲线
plt.subplot(1, 2, 2)
plt.plot(history.history['accuracy'], label='Training Accuracy')
plt.plot(history.history['val_accuracy'], label='Validation Accuracy')
plt.title('Accuracy Curve')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.legend()
plt.tight_layout()
plt.show()

结果分析

1. 损失曲线分析(1) 正常情况：

解释：

行动：

(2) 过拟合：

解释：

行动：

(3) 欠拟合：

解释：

行动：

2. 准确率曲线分析(1) 正常情况：

解释：

行动：

(2) 过拟合：

解释：

行动：

(3) 欠拟合：

解释：

行动：

3. 分析与总结方法

通过观察损失和准确率曲线，可以判断模型的性能问题：

是否过拟合或欠拟合：

训练过程的收敛性：

调整优化方向：

通过这个案例，你可以快速上手 NLP 的基本流程，并学习如何处理序列化文本数据，构建强大的分类模型！

附录：完整代码

import tensorflow as tf
from tensorflow.keras.datasets import imdb
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense
import matplotlib.pyplot as plt
# 加载 IMDb 数据集
vocab_size = 10000  # 仅保留最常用的 10000 个单词
(x_train, y_train), (x_test, y_test) = imdb.load_data(num_words=vocab_size)
# 数据预处理：填充序列
max_len = 200  # 限定序列的最大长度
x_train = pad_sequences(x_train, maxlen=max_len, padding='post')
x_test = pad_sequences(x_test, maxlen=max_len, padding='post')
# 模型构建
model = Sequential([
    Embedding(input_dim=vocab_size, output_dim=64, input_length=max_len),
    LSTM(64, return_sequences=False),
    Dense(1, activation='sigmoid')  # 二分类问题
])
# 编译模型
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
# 训练模型
history = model.fit(
    x_train, y_train,
    epochs=5,
    batch_size=64,
    validation_split=0.2
)
# 测试模型
loss, accuracy = model.evaluate(x_test, y_test)
print(f"测试集准确率: {accuracy * 100:.2f}%")
# 绘制损失曲线
plt.figure(figsize=(12, 5))
plt.subplot(1, 2, 1)
plt.plot(history.history['loss'], label='Training Loss')
plt.plot(history.history['val_loss'], label='Validation Loss')
plt.title('Loss Curve')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()
plt.savefig('output1.png')
# 绘制准确率曲线
plt.subplot(1, 2, 2)
plt.plot(history.history['accuracy'], label='Training Accuracy')
plt.plot(history.history['val_accuracy'], label='Validation Accuracy')
plt.title('Accuracy Curve')
plt.xlabel('Epoch')
plt.ylabel('Accuracy')
plt.legend()
plt.tight_layout()
# plt.show()
plt.savefig('output2.png')

上一条查看详情 +AI 刷题 33. 卡牌翻面求和问题题解 | 豆包MarsCode AI刷题

下一条 查看详情 +没有了