人工智能 (AI) 广泛地组织成七个核心领域,每个领域都处理特定的技术挑战。这些领域包括机器学习 (ML)、自然语言处理 (NLP)、计算机视觉、机器人技术、专家系统、规划和决策以及语音识别。 这些领域侧重于不同的问题,例如数据驱动的模式识别 (ML)、人机语言交互 (NLP)、视觉数据解释(计算机视觉)和自主系统控制(机器人技术)。 开发人员通常根据其应用需求、工具和算法专注于这些领域中的一个或多个。
机器学习涉及训练模型以从数据中进行预测或决策,使用监督学习(例如,回归、分类)或非监督学习(例如,聚类)等技术。 例如,流媒体平台上的推荐系统使用协同过滤来推荐内容。 自然语言处理处理文本或语音分析,例如使用诸如 BERT 之类的转换器模型进行情感分类,或者使用序列到序列架构构建聊天机器人。 计算机视觉专注于从图像或视频中提取信息,例如使用 YOLO(仅看一次)进行对象检测或使用 OpenCV 进行面部识别。 这些领域经常重叠——例如,训练自动驾驶汽车需要将计算机视觉(检测障碍物)与 ML(预测驾驶员行为)相结合。
机器人技术集成硬件和软件以创建自主系统,例如使用 ROS(机器人操作系统)的工业机器人在装配线上使用。 专家系统依靠基于规则的推理来执行专门的任务,例如使用知识图诊断医疗状况。 规划和决策涉及诸如 A* 搜索或强化学习(例如,AlphaGo)之类的算法来优化行动序列。 语音识别使用 Mozilla DeepSpeech 或云 API 等工具将口语转换为文本。 在这些领域工作的开发人员通常使用诸如 TensorFlow (ML)、PyTorch (NLP) 或 OpenCV (计算机视觉) 之类的框架来实现解决方案。 了解这些领域有助于工程师选择正确的工具和方法来执行诸如自动化工作流程、分析数据或构建智能应用程序之类的任务。