Sentence Transformers 生成文本的密集向量表示,除了语义搜索或文本分类等典型任务之外,还可以用于各种创造性的方式。一个未被充分利用的应用是通过利用它们识别类比或语义相关的句子的能力来生成写作提示。 通过将句子编码为嵌入,开发人员可以比较文本在概念上的相似性——即使它们不共享关键字——以发现意想不到的联系。 例如,输入“一段暴风雨般的关系”这样的短语可以通过找到具有相似情感或结构模式的嵌入来产生诸如“一艘在湍急的水域中航行的船”之类的类比。 这种方法允许作家通过间接比较来探索主题,从而激发创造力。
一个实际的实现可能涉及策划一个包含各种句子的数据集(例如,引言、隐喻或故事开头),并使用像 all-MiniLM-L6-v2
这样的预训练模型对它们进行编码。 当用户提供种子短语时,系统会计算种子的嵌入和数据集之间的余弦相似度以检索最佳匹配项。 例如,像“时间治愈伤口”这样的种子可能会返回诸如“铁锈慢慢地腐蚀金属”或“雨水侵蚀石头”之类的类比。 开发人员可以通过过滤特定语法结构(例如,隐喻)或使用聚类来分组主题来优化结果。 像 FAISS 或 Annoy 这样的工具可以加速大型数据集中的相似性搜索,从而使这在实时应用程序中可行。
另一个不明显的用途是创建交互式故事讲述工具,这些工具可以建议情节转折或角色动态。 例如,一个用户写一个关于背叛的场景,可以查询一个虚构对话或情节摘要的数据集,以检索诸如“一个低语的秘密分裂了一个王国”或“一个用谎言包裹的礼物”之类的句子。 通过将 Sentence Transformers 与基于模板的提示生成相结合,开发人员可以构建提出上下文感知建议的系统,帮助作家克服障碍。 此外,在特定类型的数据(例如,科幻小说或浪漫小说)上微调模型可以定制输出以匹配故事的基调。 这种方法表明,Sentence Transformers 如何可以作为创造力的协作工具,而不仅仅是分析引擎。