语境在 NLP 中至关重要,因为语言本质上是模棱两可的。 词语和短语可以有多种含义,而它们的正确解释通常取决于周围的文本。 例如,“银行”一词可以指金融机构、河流的边缘或倾斜飞机。 如果没有语境,NLP 模型可能难以区分这些含义。 同样,像“它”或“他们”这样的代词需要语境来解析它们的指代对象。 现代 NLP 模型(例如 Transformer)通过分析句子或文档中单词之间的关系,使用语境来分配准确的含义。 例如,BERT 处理双向语境,使其在解释 token 时可以考虑前面和后面的单词。
语境还使 NLP 系统能够处理依赖于序列和结构的任务。 诸如文本生成、摘要或问答之类的任务依赖于理解思想如何在句子之间连接。 例如,在对话系统中,用户可能会说“我需要一个充电器”,然后说“我的笔记本电脑用的那个”。 该模型必须将“那个”链接到上一句中的“充电器”才能正确响应。 如果不跟踪此语境,系统可能无法提供相关的答案。 同样,在机器翻译中,词序和习语在不同语言之间有所不同。 翻译“我用望远镜看到了那个人”需要知道“用望远镜”是修饰“看到”(使用的工具)还是“那个人”(拿着它的人),这由语境决定。
最后,语境提高了实际应用中的准确性。 例如,情感分析模型需要识别讽刺或否定,这取决于周围的词语。 由于语境,“这部电影太烂了,反而很棒”这句话的情感发生了转变,如果单独分析,模型可能会误解。 共指消解——将“他”或“这个”之类的提及链接到它们的前身——是另一项需要语境的任务。 例如,在“爱丽丝给鲍勃一本书。他感谢了她”中,该模型必须将“他”映射到鲍勃,将“她”映射到爱丽丝。 如果没有语境,这种关系就会变得不清楚。 通过利用语境,NLP 模型可以减少错误并提供更像人类的理解,使其适用于聊天机器人、搜索引擎和自动化内容分析等应用。