卷积神经网络是如何工作的?
趋势

卷积神经网络是如何工作的?

近年来深度学习的突破来自卷积神经网络(CNNs或ConvNets)的发展。它是深度神经网络领域发展的主力军,在图像识别上甚至可以比人类更精确。
发布日期:2022年10月06日
卷积神经网络是如何工作的?

什么是卷积神经网络?

卷积神经网络(Convolutional Neural Network)是一种前馈神经网络,其人工神经元可以对部分覆盖区域内的周围单元做出反应,对于大规模图像处理具有优异的性能。卷积神经网络由一个或多个卷积层和一个顶部完全连接层,以及相关的权值和池化层组成。这种结构使卷积神经网络能够利用输入数据的二维结构。与其他深度学习架构相比,卷积神经网络在图像和语音识别方面可以给出更好的结果。这个模型也可以使用反向传播算法进行训练。与其他深度前馈神经网络相比,卷积神经网络需要考虑的参数更少,这使其成为一种颇具吸引力的深度学习架构。

卷积神经网络(Convolutional Neural Network)在图像识别方面非常强大,很多图像识别模型也在CNN架构的基础上进行了扩展。另外值得一提的是,CNN模型是参照人类大脑的视觉组织建立的深度学习模型。学习CNN可以帮助我学习其他深度学习模型。

特点:

CNN比较了图像的各个部分,这些部分被称为特征。通过比较相似位置的粗糙特征,cnn更善于区分图像是否相同,而不是比较整个图像。图像中的每个特征就像一个更小的图像,也就是一个更小的二维矩阵,这些特征捕获了图像中的共同元素。

卷积:

每当CNN解析一个新图像时,如果不知道上面的特征在哪里,CNN就会比较图像中的任何地方。为了计算整个图像中有多少匹配的特征,我们在这里创建了一个过滤机制。这个机制背后的数学原理叫做卷积(convolution),这也是CNN这个名字的由来。

卷积的基本原理是计算特征与图像部分的符合度,如果将两者的每个像素值相乘,再除以像素的个数。如果两个图像的每个像素都匹配,将这些乘积相加,再除以像素数,得到1。反之,如果两个像素完全不同,则得到-1。重复上述过程,总结出图像中各种可能的特征,就可以完成卷积。根据每个卷积的值和位置,做出一个新的二维矩阵。这是经过特征过滤的原始图像,它可以告诉我们在原始图像的哪里可以找到特征。值越接近1的部分与特征越一致,值越接近-1,差异越大;至于值接近0的部分,则几乎完全没有相似之处。下一步是将同样的方法应用到不同的特征上,并在图像的各个部分进行卷积。最后,我们会得到一组经过过滤的原始图像,每一张图像对应一个特征。 Simply think of the entire convolution operation as a single processing step. In the operation of CNNs, this step is called a convolutional layer, which means that there are more layers to follow.

CNN的工作原理是计算密集型的。虽然我们可以在一张纸上解释一个CNN是如何工作的,但加法、乘法和除法的数量可以在这一过程中迅速增加。由于影响计算数量的因素如此之多,CNN处理的问题可能会变得非常复杂,这也难怪一些芯片制造商正在为CNN的计算需求设计和制造专门的芯片。

池:

Pooling是一种压缩图像并保留重要信息的方法。它的工作原理只需要数学的二级学位就可以理解。Pooling会在图像上选择不同的窗口,并在这个窗口范围内选择一个最大值。在实践中,边长为2或3的正方形是一个两像素步幅的理想设置。

原始图像被池化后,它所包含的像素数量会减少到原始图像的四分之一,但由于池化后的图像包含了原始图像中每个范围的最大值,所以它仍然保留了每个范围和每个范围。特征的一致性程度。汇集的信息更关注图像中是否有匹配的特征,而不是这些特征在图像中存在的位置。可以帮助CNN判断一个特征是否包含在图像中,而不必被特征的位置分散注意力。

池化层的功能是将一张或几张图片池化为较小的图片。我们最终得到了一张像素数相同,但像素更少的图像。有助于改善刚才提到的计算开销大的问题。提前将一张800万像素的图像减少到200万像素,可以让后续的工作更容易。

线性整流单元:

CNN的一个重要步骤是校正线性单元(ReLU),它在数学上将图像上的所有负数转换为0。这个技巧可以防止cnn接近0或无穷大。线性校正后的结果将与原始图像具有相同的像素数,只是所有负值将被替换为零。

深度学习:

原始图像经过过滤、校正、汇集后,会变成一组包含特征信息的小图像。然后再对这些图像进行过滤和压缩,它们的特征会随着每一次处理而变得更加复杂,图像也会变得更小。最后一个较低层次的处理层包含一些简单的特征,比如角落或者光点。高阶处理层包含更复杂的特征,比如形状或图案,而这些高阶特征通常很容易被识别。

完全连接层:

全连通层会在一个高层次上收集过滤后的图片,并将这个特征信息转化为选票。在传统的神经网络架构中,全连通层的作用是主要的初级构建块。当我们向这个单元输入图像时,它把所有像素值都当作一维列表,而不是以前的二维矩阵。列表中的每个值决定了图片中的符号是圆还是叉。由于有些值更善于辨别叉,有些值更善于辨别圆,所以这些值会比其他值获得更多的选票。所有值对不同选项所投的票数将用权重或连接强度来表示。所以,每当CNN对一个新图像进行评判时,该图像在到达完全连接层之前会经过许多较低的层。投票结束后,得票最多的选项就会成为这张图片的类别。

和其他层一样,多个全连接层可以组合,因为它们的输入(列表)和输出(选票)的形式相似。在实践中,可以将多个全连接层组合在一起,在其中的几个层上会出现几个虚拟的、隐藏的投票选项。每当添加一个全连接层,整个神经网络就能学习到更复杂的特征组合,做出更准确的判断。

反向传播:

反向传播的机器学习技巧可以帮助我们确定权重。要使用反向传播,需要准备一些已经有答案的图片,然后必须准备一个未经训练的CNN,其中任何像素、特征、权重和全连接层的值都是随机确定的。你可以用一个标记过的图像来训练这个CNN。

经过CNN的处理,每张图片最终都会有一轮选举来决定类别。与之前标记的正解相比,就是识别误差。通过调整特征和权重,减少了选举产生的误差。在每次调整后,这些特征和权重被微调高一点或低一点,误差被重新计算,成功减少误差的调整被保留。所以,当我们调整卷积层中的每个像素和全连通层中的每个权重时,我们可以得到一组对当前图像的判断能力稍好一些的权重。然后重复上面的步骤,识别出更多带标签的图像。在训练过程中,个别图片中的误判会过去,但这些图片中的共同特征和权重会保留下来。如果有足够多的标记图像,这些特征和权重的值最终会接近一个稳定的状态,能够很好地识别大多数图像。但反向传播也是一个计算成本非常高的步骤。

Hyperparameters:

  • 每个卷积层应该有多少个特征?每个特征中应该有多少像素?
  • 每个池化层的窗口大小是多少?间隔应该多长?
  • 每个额外的全连接层应该有多少个隐藏神经元(选项)?

除了这些问题,我们还需要考虑很多高层的结构问题,比如一个CNN中应该有多少个处理层,按照什么顺序。一些深度神经网络可能包括数千个处理层,有很多设计的可能性。有了这么多排列,我们只能测试CNN设置的一小部分。因此,CNN的设计通常会随着机器学习社区积累的知识而进化,偶尔也会有一些意想不到的性能提升。此外,许多改进技术都经过了测试并发现是有效的,例如使用新的处理层或以更复杂的方式连接不同的处理层。

发布于2022年10月06日 来源:mcknote

进一步的阅读

你可能还会对……

标题
趋势
什么是云服务?了解云计算和云存储
随着全球对云计算的需求持续翻倍,云计算并不是一时兴起,而是几十年信息技术慢慢发展起来的一种技术和各种应用。随着时代的快速进步和大环境的变化,大众随时都可以享受到云服务。
标题
趋势
什么是量子计算机?量子计算发展面临的挑战是什么?
量子计算机的真正力量不在于计算速度,而在于并行处理问题的能力。通过利用量子物理的不确定性,它可以彻底改变医学,加速人工智能,颠覆密码学。
标题
趋势
什么是数据湖?
数据湖是一个集中的存储库,用于存储、处理和保护大量结构化、半结构化和非结构化数据。它可以以其原生格式存储数据,并处理任何转换格式,而不受大小限制。
标题
趋势
什么是Mods和模块化设计?
通过模块化,设计出一系列通用功能模块,并根据要求对这些模块进行选择和组合,形成不同性能和规格的产品。
标题
趋势
理解DevOps企业文化及其好处
DevOps是一种企业文化、自动化和平台设计的方法,通过提供快速、高质量的服务,依靠快节奏和可重复的IT服务,提高业务价值和弹性。
标题
趋势
制造业结合增强现实和虚拟现实,创造数字现实体验
利用工业增强现实技术和虚拟现实,通过实时分步工作指导,进一步提高员工生产率、效率和客户满意度。
标题
趋势
AIoT如何帮助智能交通?
AI和IoT技术如何帮助行人、交通单位和警察单位,帮助交通顺畅、方便和安全?
标题
趋势
《绿色经济对全球可持续发展的重要性》
绿色经济是全球现状的必然趋势。各国政府也必须从根本上改革其政策。实现这一目标并不容易,但如果我们想走向可持续发展,绿色经济将成为关键。
标题
趋势
什么是人工智能?未来趋势
什么是人工智能(AI)?目前,人工智能在哪些生活场景中得到了应用?它将如何改变未来?人工智能是新时代的力量。未来,不会有与人工智能无关的现代产业。人工智能(AI)已经照亮了新一代技术的前景。从那以后,人们迅速地利用海量数据进行分析和进行机器学习。解,导致了最好的决策。这个技术是如何工作的,又是如何推动其他新技术的发展的?人工智能的发展趋势是什么?
标题
趋势
全球供应链的发展趋势和风险
为了应对疫情带来的供应链挑战,供应链的布局将更加以弹性为导向,即愿意牺牲一些高成本、高效率的指标,来换取供应链管理的灵活性和弹性。
标题
趋势
后大流行时代:全球物流行业的新趋势
全球物流业在疫情爆发中首当其冲。疫情初期,城市关闭、边境关闭、航班停飞,但与此同时,个人防护装备和生活必需品的需求也达到了顶峰。电商购物的激增给全球供应链带来了额外的压力,而最近的疫苗交付也给供应链带来了新的挑战。后疫情时代的生活,是全世界密切关注的问题。到那个时候,全球物流形势会是什么样子?在大流行期间采取的创新和转变中,哪些将持续下去并影响国际运输?本文将逐一回答。
标题
趋势
航空航天工业的六大新技术趋势
航空航天高科技产业的发展与军事应用密切相关,但更重要的是,人类在这一产业上取得的巨大进步,对经济和生活的许多方面都产生了重大而深远的影响,推动和改变了世界的面貌。进入21世纪,航天活动的作用将远远超出科学领域,将对政治、经济、军事和人类社会生活产生更广泛的影响,并将不断创造新的科技成果和巨大的经济效益。
同意