更新时间:2025-03-28 14:40:08
封面
版权信息
前言
第1章 数字识别
1.1 MNIST数据集
1.1.1 MNIST 数据集简介
1.1.2 导入数据集
1.2 构建模型
1.2.1 定义神经网络
1.2.2 前向传播
1.2.3 计算损失
1.2.4 反向传播与更新参数
1.3 开始训练
1.4 观察模型预测结果
1.5 总结
第2章 ImageNet图像识别模型与CIFAR-10
2.1 图像分类器
2.1.1 CIFAR-10数据集简介
2.1.2 加载数据集
2.1.3 定义卷积神经网络
2.1.4 定义损失函数和优化器
2.1.5 训练网络
2.1.6 使用测试集评估
2.1.7 使用GPU加速
2.2 ImageNet和图像识别模型
2.2.1 ImageNet
2.2.2 基于 ImageNet 的图像识别模型
2.3 总结
第3章 从零构建图像分类模型
3.1 预训练模型原理
3.1.1 状态字典
3.1.2 通过设备保存
3.2 加载ImageNet预训练模型
3.3 准备数据
3.3.1 加载数据集
3.3.2 使用matplotlib可视化数据
3.4 开始训练
3.5 使用torchvision微调模型
3.6 观察模型预测结果
3.7 固定模型的参数
3.8 使用tensorbord可视化训练情况
3.9 总结
第4章 文本生成
4.1 RNN原理及其结构
4.1.1 经典RNN结构
4.1.2 N VS 1式RNN结构
4.1.3 1 VS N RNN结构
4.1.4 N VS M RNN结构
4.2 明确任务
4.3 准备数据
4.4 构建模型
4.5 开始训练
4.6 观察交互结果
4.7 总结
第5章 目标检测和实例分割
5.1 快速了解目标检测
5.1.1 评估方法
5.1.2 直观方法
5.2 R-CNN系列模型的原理
5.2.1 R-CNN原理
5.2.2 Fast R-CNN原理
5.2.3 Faster R-CNN原理
5.2.4 Mask R-CNN原理
5.3 使用torchvison微调模型
5.3.1 使用Penn-Fudan数据集
5.3.2 搭建目标检测模型
5.3.3 下载必要的工具文件
5.3.4 改造模型以适应新的数据集
5.3.5 调用工具文件训练模型
5.3.6 评估和测试模型
5.4 总结
第6章 人脸检测与识别
6.1 模型介绍
6.2 facenet-pytorch库
6.3 预训练模型
6.4 总结
第7章 利用DCGAN生成假脸
7.1 GAN及其原理
7.2 DCGAN简介
7.3 实现一个假脸生成模型
7.3.1 模型设定
7.3.2 人脸数据集
7.3.3 实现生成器
7.3.4 实现判别器
7.3.5 损失函数和优化器
7.4 训练假脸生成模型
7.4.1 训练的整体流程
7.4.2 更新判别器
7.4.3 更新生成器
7.5 可视化结果
7.6 总结
第8章 pix2pix为黑白图片上色
8.1 带约束的生成对抗网络
8.2 pix2pix的原理
8.3 实现图到图翻译模型
8.3.1 Facade数据集
8.3.2 U-Net作为生成器
8.3.3 PatchGAN作为判别器
8.4 训练判别器和生成器
8.4.1 更新判别器