机器视觉算法入门的几个孪生概念

卷积/卷积核

卷积(Convolution) 和 卷积核(Convolution Kernel) 是在图像处理和卷积神经网络(CNN)中密切相关的两个概念。

卷积

卷积是一种数算,也称为卷积运算,它在信号处理、图像处理以及机器学习领域有着广泛应用。

•在图像处理中,卷积操作涉及将一个称为卷积核(或滤波器、模板)的小矩阵在图像上滑动,对核覆盖的图像区域内的像素值进行加权求和。这个过程能够提取图像的特定特征,如边缘、纹理等。

•通过卷积,可以实现图像的降噪、锐化、模糊等效果,或是特征提取,是构建卷积神经网络的基础运算之一。

卷积核

卷积核,也称为滤波器或卷积模板,是一个小型的矩阵,通常包含实数值,用于在卷积操作中与图像的一部分进行计算。

•卷积核的大小(例如3x3、5x5等)和其中的权重值是事先设定或通过学习得到的。这些权重决定了在卷积运算中哪些图像特征会被强调或抑制。

•不同的卷积核可以捕获图像的不同特征,比如水平边缘、垂直边缘、纹理等。在卷积神经网络中,通过学习过程自动调整这些权重,以优化模型对特定任务的表现。

•卷积核在图像上滑动时,每次覆盖图像的一个局部区域,与该区域内的像素值逐一相乘(有时在计算前会先将卷积核旋转180度),然后求和得到输出图像的一个像素值。

简而言之,卷积是一种操作或过程,它利用卷积核来提取图像特征。卷积核是卷积过程中的关键参数,决定了特征提取的方式和类型。在深度学习尤其是卷积神经网络中,卷积核的自动学习是模型能够识别和分类图像的关键机制。

直方图(Histogram)

•直方图是统计学中表示数据分布的图形方法,在图像处理领域中,它用来描述图像中像素强度(如灰度值)的分布情况。具体而言,它是一个柱状图,横轴表示像素的灰度级(或颜色值),纵轴表示该灰度级像素的数量或频率。

•对于灰度图像,直方图显示了每个灰度级在图像中出现的频次,从而直观地反映了图像的明暗分布和整体对比度。直方图是理解和分析图像特性的重要工具,也是进行图像增强、分割、匹配等预处理的基础。

直方图均衡化(Histogram Equalization)

•直方图均衡化是一种图像增强技术,旨在改善图像的全局对比度,尤其是当图像的大部分像素集中在较窄的灰度范围内时。该方法通过改变图像的灰度级分布,使得变换后的图像直方图接近均匀分布。

•实现均衡化的过程涉及计算原图像直方图的累计分布函数(CDF),然后根据这个函数映射原图像的每个像素值到新的灰度级,以达到扩展像素值动态范围的目的。这样做的结果是提高了图像的对比度,使得图像的暗部和亮部细节更加明显。

•均衡化不改变图像的总体亮度,但能有效增强图像中原本对比度较低的区域,使之更适合视觉观察或进一步的图像分析。尽管如此,均衡化也可能增强噪声,且对于具有特定亮度分布的图像(如日出或夜景)可能不总是产生理想效果。

简而言之,直方图是图像灰度级分布的图形表示,而直方图均衡化是一种基于直方图分析的图像处理技术,通过调整像素值分布来增强图像的对比度和视觉效果。