文本相似性计算

2024/10/4 19:29:31

【AI知识点】词频-逆文档频率(TF-IDF)

词频-逆文档频率(TF-IDF,Term Frequency-Inverse Document Frequency)是一种用来衡量一个词在某个文档中的重要性,同时结合该词在整个文档集中的出现频率。它的核心思想是:在特定文档中出现频率高且在其他文档中较少出…