参考:https://www.youtube.com/watch?v=B_2bntDYano 困惑度 perplexity 是一种用来衡量语言模型性能的度量,类似于交叉熵。 困惑度越低越好,越低说明一个模型越好。 一个典型的公式在下面: