在机器人学中,“可供性 (affordance)”指的是基于机器人自身能力,物体或环境所提供的可操作的可能性。这是一个从心理学借用的概念,在心理学中,人类可以直观地理解如何与物体互动(例如,椅子可以用来坐)。 对于机器人,可供性被显式建模,以便根据感觉输入,做出关于哪些动作是可能的决策。 例如,门把手的形状和位置可能提供抓握和拉动的可能性,而平坦的表面可能提供放置物体的可能性。 可供性连接了感知(机器人感知到的)和行动(机器人可以做的),使机器人无需详尽的预编程规则即可推理其周围环境。
机器人通过将传感器数据(例如,相机、激光雷达)与学习到的或编程的知识相结合来使用可供性。 一种常见的方法是训练机器学习模型来检测与特定动作相关的对象特征。 例如,机器人可能会学习到在 3D 扫描中检测到的圆柱形把手是可以抓握的,或者在臀部高度的矩形表面很可能是用于放置物品的桌子。 开发人员通常使用语义标签(例如,“可推”、“可移动”)与几何约束(例如,对象大小、方向)配对来编码可供性。 在移动机器人中,诸如“可导航”之类的可供性可能源自地形坡度或障碍物高度。 这些模型使机器人能够跨环境进行泛化——例如,识别出工厂中的杠杆和家庭厨房中的杠杆都可以拉动,即使外观存在差异。
实现可供性的挑战包括处理对象形状、材料和环境上下文的可变性。 杯子盛放液体的可供性取决于其方向——机器人必须从视觉或触觉反馈中推断出的细节。 解决方案通常涉及分层表示:低级可供性(例如,“可抓握区域”)进入更高级别的任务计划(例如,“倒水”)。 卷积神经网络 (CNN) 等视觉可供性检测工具或用于试错交互的强化学习被广泛使用。 对于开发人员来说,集成可供性通常需要模块化设计——分离感知、可供性映射和动作执行——以保持灵活性。 通过关注机器人可以做什么而不是物体是什么,可供性将复杂的环境简化为可操作的决策,使机器人更具适应性和效率。