计算机视觉的先驱被普遍认为是拉里·罗伯茨(Larry Roberts),他在 20 世纪 60 年代的工作为该领域奠定了基础。罗伯茨常被称为“计算机视觉之父”,他致力于使机器能够通过分析二维图像来重建三维场景,从而解释视觉数据。他在 1963 年麻省理工学院的博士论文《三维物体的机器感知》(Machine Perception of Three-Dimensional Solids)展示了算法如何识别简单块状图像中的边缘、角点和表面。这是开创性的,因为它将重点从硬件(如相机)转移到基于软件的视觉数据解释,建立了至今仍在使用的核心原则。
罗伯茨的早期工作引入了边缘检测和特征提取等概念,这些概念至今仍是计算机视觉的基础。例如,他的算法使用梯度计算来识别图像中的边缘,这项技术后来演变成 Sobel 算子和 Canny 边缘检测器等方法。他在块状场景中的实验也启发了后来在物体识别和场景理解方面的研究。虽然罗伯茨的系统仅限于包含基本形状的受控环境,但它们证明了机器可以通过算法解析视觉信息。这为实际应用(如医学成像和机器人技术)打开了大门,在这些应用中,解释结构化视觉数据至关重要。
随着该领域的扩展,罗伯茨工作的影响变得更加清晰。在 20 世纪 70 年代和 80 年代,像大卫·马尔(David Marr)和金出武雄(Takeo Kanade)这样的研究人员在他的思想基础上,解决了更复杂的问题,如运动分析和面部识别。现代框架如 OpenCV 和深度学习模型(例如 CNNs)依赖于罗伯茨探索过的相同基础原则——处理像素数据以提取有意义的模式。对于开发者来说,理解这一传承有助于将卷积层或霍夫变换等自动化罗伯茨曾用更简单数学方法处理的任务的工具置于背景中。他的贡献强调,即使是基本的算法见解也能推动人工智能和自动化等领域数十年的创新。