计算机视觉 (CV) 是人工智能领域的一个分支,专注于使机器能够解释和理解图像或视频等视觉数据。其目标是提取有意义的信息——例如识别物体、检测模式或理解场景——以支持决策。另一方面,图像处理 (IP) 是指用于处理或分析图像的技术,旨在提高图像质量、提取细节或将其转换为更易用的形式。尽管这两个领域都处理视觉数据,但 CV 旨在获得高层理解,而 IP 则侧重于修改或增强原始数据本身。
CV 和 IP 之间的关系是层级性的。IP 通常作为 CV 任务的预处理步骤。例如,在计算机视觉系统检测图像中的人脸之前,它可能会使用 IP 方法(如降噪(例如高斯模糊)或对比度调整)来清理输入。类似地,边缘检测算法(一种常见的 IP 技术)可能会突出物体边界,然后 CV 算法利用这些边界来识别形状或跟踪运动。反之,CV 也可以通过提供上下文来指导 IP——例如使用物体识别来确定图像的哪些部分需要增强。OpenCV 等库集成了这两个领域,提供了用于过滤、转换和分析图像的工具,从而连接了这两个领域。
从事 CV 项目的开发者通常依赖 IP 技术来提高输入质量或降低计算复杂度。例如,在将图像送入神经网络 (CV) 之前对其进行缩放 (IP) 可以加快处理速度而不会牺牲准确性。一个实际例子是自动驾驶汽车:IP 算法纠正摄像头图像的镜头畸变或调整光照,而 CV 系统则解释清理后的数据以检测行人或交通标志。理解这两个领域使开发者能够优化流程——例如将直方图均衡化 (IP) 与卷积神经网络 (CV) 相结合以改善医学图像分析。CV 处理图像中的“是什么”,而 IP 则处理“如何”准备或优化图像,使它们成为解决视觉计算问题的互补工具。