使用Numpy从头构建卷积神经网络_环球科技网

使用该网络对手写数字进行分类。所获得的结果不是最先进的水平，但仍然令人满意。现在想更进一步，我们的目标是开发一个仅使用Numpy的卷积神经网络（CNN）。

这项任务背后的动机与创建全连接的网络的动机相同：尽管Python深度学习库是强大的工具，但它阻止从业者理解底层正在发生的事情。对于CNNs来说，这一点尤其正确，因为该过程不如经典深度网络执行的过程直观。

解决这一问题的唯一办法是尝试自己实现这些网络。

(相关资料图)

打算将本文作为一个实践教程，而不是一个全面指导CNNs运作原则的教程。因此，理论部分很窄，主要用于对实践部分的理解。

对于需要更好地理解卷积网络工作原理的读者，留下了一些很好的资源。

什么是卷积神经网络？

卷积神经网络使用特殊的结构和操作，使其非常适合图像相关任务，如图像分类、对象定位、图像分割等。它们大致模拟了人类的视觉皮层，每个生物神经元只对视野的一小部分做出反应。此外，高级神经元对其他低级神经元的输出做出反应［1］。

正如我在上一篇文章中所展示的，即使是经典的神经网络也可以用于图像分类等任务。问题是，它们仅适用于小尺寸图像，并且在应用于中型或大型图像时效率极低。原因是经典神经网络需要大量的参数。

例如，200x200像素的图像具有40＇000个像素，如果网络的第一层具有1＇000个单位，则仅第一层的权重为4000万。由于CNN实现了部分连接的层和权重共享，这一问题得到了高度缓解。

卷积神经网络的主要组成部分包括：

· 卷积层

· 池化层

卷积层

卷积层由一组滤波器（也称为核）组成，当应用于层的输入时，对原始图像进行某种修改。滤波器是一种矩阵，其元素值定义了对原始图像执行的修改类型。类似以下的3x3内核具有突出显示图像中垂直边的效果：

不同的是，该核突出了水平边：

核中元素的值不是手动选择的，而是网络在训练期间学习的参数。

卷积的作用是隔离图像中存在的不同特征。Dense层稍后使用这些功能。

池化层

池化层非常简单。池化层的任务是收缩输入图像，以减少网络的计算负载和内存消耗。事实上，减少图像尺寸意味着减少参数的数量。

池化层所做的是使用核（通常为2x2维）并将输入图像的一部分聚合为单个值。例如，2x2最大池核获取输入图像的4个像素，并仅返回具有最大值的像素。

Python实现

此GitHub存储库中提供了所有代码。

这个实现背后的想法是创建表示卷积和最大池层的Python类。此外，由于该代码后来被应用于MNIST分类问题，我为softmax层创建了一个类。

每个类都包含实现正向传播和反向传播的方法。

这些层随后被连接在一个列表中，以生成实际的CNN。

卷积层实现

class ConvolutionLayer：

def ＿＿init＿＿（self， kernel＿num， kernel＿size）：

self．kernel＿num ＝ kernel＿num

self．kernel＿size ＝ kernel＿size

self．kernels ＝ np．random．randn（kernel＿num， kernel＿size， kernel＿size）／（kernel＿size＊＊2）

def patches＿generator（self， image）：

image＿h， image＿w ＝ image．shape

self．image ＝ image

for h in range（image＿h－self．kernel＿size＋1）：

for w in range（image＿w－self．kernel＿size＋1）：

patch ＝ image［h：（h＋self．kernel＿size）， w：（w＋self．kernel＿size）］

yield patch， h， w

def forward＿prop（self， image）：

image＿h， image＿w ＝ image．shape

convolution＿output ＝ np．zeros（（image＿h－self．kernel＿size＋1， image＿w－self．kernel＿size＋1， self．kernel＿num））

for patch， h， w in self．patches＿generator（image）：

convolution＿output［h，w］＝ np．sum（patch＊self．kernels， axis＝（1，2））

return convolution＿output

def back＿prop（self， dE＿dY， alpha）：

dE＿dk ＝ np．zeros（self．kernels．shape）

for patch， h， w in self．patches＿generator（self．image）：

for f in range（self．kernel＿num）：

dE＿dk［f］＋＝ patch ＊ dE＿dY［h， w， f］

self．kernels －＝ alpha＊dE＿dk

return dE＿dk

构造器将卷积层的核数及其大小作为输入。我假设只使用大小为kernel＿size x kernel＿size的平方核。

在第5行中，我生成随机滤波器（kernel＿num、kernel＿size、kernel＿size），并将每个元素除以核大小的平方进行归一化。

patches＿generator（）方法是一个生成器。它产生切片。

forward＿prop（）方法对上述方法生成的每个切片进行卷积。

最后，back＿prop（）方法负责计算损失函数相对于层的每个权重的梯度，并相应地更新权重值。注意，这里提到的损失函数不是网络的全局损失。相反，它是由最大池层传递给前一卷积层的损失函数。

为了显示这个类的实际效果，我用32个3x3滤波器实例化了一个卷积层对象，并将正向传播方法应用于图像。输出包含32个稍小的图像。

原始输入图像的大小为28x28像素，如下所示：

在应用卷积层的前向传播方法后，我获得了32幅尺寸为26x26的图像。这里我绘制了其中一幅：

如你所见，图像稍小，手写数字变得不那么清晰。考虑到这个操作是由一个填充了随机值的滤波器执行的，所以它并不代表经过训练的CNN实际执行的操作。

尽管如此，你可以得到这样的想法，即这些卷积提供了较小的图像，其中对象特征被隔离。

最大池层实现

class MaxPoolingLayer：

def ＿＿init＿＿（self， kernel＿size）：

self．kernel＿size ＝ kernel＿size

def patches＿generator（self， image）：

output＿h ＝ image．shape［0］／／ self．kernel＿size

output＿w ＝ image．shape［1］／／ self．kernel＿size

self．image ＝ image

for h in range（output＿h）：

for w in range（output＿w）：

patch ＝ image［（h＊self．kernel＿size）：（h＊self．kernel＿size＋self．kernel＿size），（w＊self．kernel＿size）：（w＊self．kernel＿size＋self．kernel＿size）］

yield patch， h， w

def forward＿prop（self， image）：

image＿h， image＿w， num＿kernels ＝ image．shape

max＿pooling＿output ＝ np．zeros（（image＿h／／self．kernel＿size， image＿w／／self．kernel＿size， num＿kernels））

for patch， h， w in self．patches＿generator（image）：

max＿pooling＿output［h，w］＝ np．amax（patch， axis＝（0，1））

return max＿pooling＿output

def back＿prop（self， dE＿dY）：

dE＿dk ＝ np．zeros（self．image．shape）

for patch，h，w in self．patches＿generator（self．image）：

image＿h， image＿w， num＿kernels ＝ patch．shape

max＿val ＝ np．amax（patch， axis＝（0，1））

for idx＿h in range（image＿h）：

for idx＿w in range（image＿w）：

for idx＿k in range（num＿kernels）：

if patch［idx＿h，idx＿w，idx＿k］＝＝ max＿val［idx＿k］：

dE＿dk［h＊self．kernel＿size＋idx＿h， w＊self．kernel＿size＋idx＿w， idx＿k］＝ dE＿dY［h，w，idx＿k］

return dE＿dk

构造函数方法只分配核大小值。以下方法与卷积层的方法类似，主要区别在于反向传播函数不更新任何权重。事实上，池化层不依赖于权重来执行。

Sigmoid层实现

class SoftmaxLayer：

def ＿＿init＿＿（self， input＿units， output＿units）：

self．weight ＝ np．random．randn（input＿units， output＿units）／input＿units

self．bias ＝ np．zeros（output＿units）

def forward＿prop（self， image）：

self．original＿shape ＝ image．shape

image＿flattened ＝ image．flatten（）

self．flattened＿input ＝ image＿flattened

first＿output ＝ np．dot（image＿flattened， self．weight）＋ self．bias

self．output ＝ first＿output

softmax＿output ＝ np．exp（first＿output）／ np．sum（np．exp（first＿output）， axis＝0）

return softmax＿output

def back＿prop（self， dE＿dY， alpha）：

for i， gradient in enumerate（dE＿dY）：

if gradient ＝＝ 0：

continue

transformation＿eq ＝ np．exp（self．output）

S＿total ＝ np．sum（transformation＿eq）

dY＿dZ ＝－transformation＿eq［i］＊transformation＿eq ／（S＿total＊＊2）

dY＿dZ［i］＝ transformation＿eq［i］＊（S＿total － transformation＿eq［i］）／（S＿total＊＊2）

dZ＿dw ＝ self．flattened＿input

dZ＿db ＝ 1

dZ＿dX ＝ self．weight

dE＿dZ ＝ gradient ＊ dY＿dZ

dE＿dw ＝ dZ＿dw［np．newaxis］．T ＠ dE＿dZ［np．newaxis］

dE＿db ＝ dE＿dZ ＊ dZ＿db

dE＿dX ＝ dZ＿dX ＠ dE＿dZ

self．weight －＝ alpha＊dE＿dw

self．bias －＝ alpha＊dE＿db

return dE＿dX．reshape（self．original＿shape）

softmax层使最大池提供的输出体积变平，并输出10个值。它们可以被解释为与数字0–9相对应的图像的概率。

结论

你可以克隆包含代码的GitHub存储库并使用main．py脚本。该网络一开始没有达到最先进的性能，但在几个epoch后达到96％的准确率。

参考引用

推荐内容

世界快报:跟ChatGPT聊投资：谈宏观话题有套路，拒绝点评个股

2023-02-08
使用Numpy从头构建卷积神经网络

2023-02-08
家乐福，大厦将倾今日精选

2023-02-08
政策指引1.65亿千瓦火电建设，或将带动2138亿元设备投资

2023-02-08
关于ChatGPT：有些饭碗还在，真的是机器人赏饭吃

2023-02-08
今日精选：【深度】动态电压恢复器（DVR）在先进制造业需求旺盛行业发展前景广阔

2023-02-08
合资车减配割韭菜一直存在，为何近年来国人对此愈加愤恨？

2023-02-08
抖音超市，背影杀手？

2023-02-08
惠程科技(002168)报收于4.34元，上涨4.08% 环球微动态

2023-02-08
瓦努阿图批准投资移民、欧盟持续免签!关键是以后护照免费送

2023-02-08
关注：定了要涨价！iPhone 15屏幕大升级

2023-02-08
【全球新要闻】汽车站标志怎么看_汽车站标志

2023-02-08
2023共享WiFi全新起航，创业风口项目，抢先一步占领市场！|天天最资讯

2023-02-08
新增6家！至少已有8家券商可自营交易碳排放，市场前景如何？有哪些投资机会？热门看点

2023-02-08
当前视讯！聚焦2023多彩贵州文旅招商推介会｜北京企业3年投资贵州项目996个3902.5亿元

2023-02-08
聚焦2023多彩贵州文旅招商推介会｜贵州将提供一流的营商环境让投资贵州一路绿灯|当前头条

2023-02-08
优化营商环境抓项目扩投资引人才忙复工我市全力推动经济持续健康高质量发展全球热头条

2023-02-08
【速看料】明牌珠宝(002574)报收于6.85元，上涨3.16%

2023-02-08
主力资金监控：医药生物板块净流出超21亿元|实时

2023-02-08
新冠病毒去哪了它会消失吗如何看待当前病例散发状态?

2023-02-08
女生上班通勤4小时坐10趟地铁打工人的噩梦？

2023-02-08
男子驾驶滑翔伞触高压线致全镇停电该男子要承担什么责任？

2023-02-08
趵突泉的锦鲤胖成“猪鲤” 这是游客投食导致的吗？

2023-02-08
“九斤重大老鼠”身份查清了你了解过海狸鼠吗？

2023-02-08
多地结婚登记平均年龄超30岁年轻人都不敢结婚了吗？

2023-02-08
男子吃霸王餐还教育老板和气生财法律对这种无赖都没有办法吗？

2023-02-08
2023-2028年中国商用灶行业市场深度分析及投资战略咨询报告当前动态

2023-02-08
2023-2028年中国人体微生物组行业市场预测与投资规划分析报告快看

2023-02-08
全球短讯！2023-2028年中国光纤光学行业市场深度分析及投资战略咨询报告

2023-02-08
全球资讯：总投资1246亿元！广东“海洋大市”阳江244个项目签约开工竣工

2023-02-08
拼多多这一刀，狠狠地砍向了SHEIN

2023-02-08
ChatGPT火爆：AI消灭平庸？

2023-02-08
天天滚动:用ChatGPT划水的第一天，宣告失败

2023-02-08
AI芯天下丨新基建丨工业互联网的2023年，是承上启下之年世界新动态

2023-02-08
百亿搞光伏，胜算几何？

2023-02-08
天天观天下！康弘药业(002773)报收于17.45元，下跌1.3%

2023-02-08
开局“春意”浓楼市“开门红”|全球今日讯

2023-02-08
小米13 Ultra曝光：2K E6曲面屏+1英寸超大底+120倍长焦

2023-02-08
男子与妻子吵架一怒之下砍断小拇指这样的婚姻还能继续吗？

2023-02-08
女子因洁牙感染梅毒？口腔机构回应梅毒经口腔传播的几率高吗？

2023-02-08
抖音入局外卖意味着什么抖音为什么要入局外卖？

2023-02-08
总价优惠100万起！豪宅「北京天誉」推特价房

2023-02-08
原来拖延症和懒没关系拖延症特别严重怎么办？

2023-02-08
466元6块糖涉事店铺修改价签这么贵的糖好在哪里？

2023-02-08
没阳过的孩子能上学吗上学后有感染风险吗?

2023-02-08
抖音将于3月1日上线全国外卖服务你知道吗？

2023-02-08
Garmin佳明智能手表助力“北极星黎明”载人航天飞行任务

2023-02-08
世界时讯：2023年家电行业的三大投资机遇

2023-02-08
华帝股份：拟12亿元投建华帝厨电数字化智能化产业园项目|环球聚焦

2023-02-08
焦点速递！家电低价“团购优惠” 实为售货员“庞氏骗局”

2023-02-08