牛逼的python库-使用FuzzyWuzzy库进行模糊字符串匹配

news/2024/11/15 7:02:39/

FuzzyWuzzy是一个Python库,用于模糊字符串匹配和字符串相似度计算。它基于Levenshtein距离算法,用于比较两个字符串之间的差异。

下面是FuzzyWuzzy库的一些常见用法:

  • 导入库和模块:

    from fuzzywuzzy import fuzz
    from fuzzywuzzy import process
    
  • 使用fuzz.ratio计算两个字符串之间的相似度:

    similarity = fuzz.ratio("apple", "aple")
    

    这会计算出两个字符串之间的相似度百分比。

  • 使用fuzz.partial_ratio计算两个部分字符串之间的相似度:

    similarity = fuzz.partial_ratio("apple", "aple")
    

    这会计算出两个字符串的部分字符串之间的相似度。

  • 使用fuzz.token_sort_ratio计算排序后的字符串之间的相似度:

    similarity = fuzz.token_sort_ratio("apple pie", "pie apple")
    

    这会计算出对两个字符串进行排序后的相似度。

  • 使用fuzz.token_set_ratio计算集合中的字符串之间的相似度:

    similarity = fuzz.token_set_ratio("apple pie is delicious", "delicious apple is pie")
    

    这会计算出集合中的字符串之间的相似度。

  • 使用process.extract函数获取一个字符串与一组候选字符串的相似度最高的匹配项:

    choices = ["apple", "banana", "orange"]
    best_match = process.extractOne("aple", choices)
    print(best_match)
    

    输出结果为:('apple', 90),表示"aple"与"apple"的相似度为90。

  • 使用process.extract函数获取一个字符串与一组候选字符串所有可能匹配项的相似度列表:

    choices = ["apple", "banana", "orange"]
    matches = process.extract("aple", choices)
    print(matches)
    

    输出结果为:[('apple', 90), ('banana', 29), ('orange', 22)],表示"aple"与每个候选字符串的相似度。

  • 使用fuzz.WRatio计算两个字符串之间的相似度,它对字符串的字符大小写不敏感:

    similarity = fuzz.WRatio("apple", "aPpLe")
    print(similarity)
    

    输出结果为:100,表示"apple"与"aPpLe"的相似度为100。

  • 使用fuzz.partial_token_sort_ratio计算排序后的部分字符串之间的相似度:

    similarity = fuzz.partial_token_sort_ratio("apple pie", "pie is delicious")
    print(similarity)
    

    输出结果为:67,表示排序后的"apple pie"与"pie is delicious"的部分字符串之间的相似度为67。


http://www.ppmy.cn/news/737721.html

相关文章

正版软件 - 迅捷全能PDF转换助手软件 ,办公必备工具。

迅捷全能PDF转换助手软件,一键支持 PDF,Word,Excel 等多种格式相互转换的办公必备工具。一键转换文档格式,把工作报告转换为PDF文档,多种文档处理功能随心编辑,转换处理更快捷,轻松实现效率办公…

单位元转换万元怎么转_元换算万元单位(元与万元的换算器)

354000元换算成万元是好多? 26052.14元换算成万元呢 35.4万元2.605214万元 就是总钱数除以10000 解:∵已知100元需换算zhidao为万元为单版位 10000元 = 10000 10000 = 1万元 ∴100元 = 100 10000 = 0.01万元 100人民币权元换算万元为0.01万元 除以1万如果您对我的回答满意,…

分辨率单位及换算详解

点击上方“小白学视觉”,选择加"星标"或“置顶” 重磅干货,第一时间送达本文转自|新机器视觉对于测试数字成像设备非常重要的参数是分辨率。但有不同的方式来表达数码相机的分辨率,有时令人困惑。下面介绍的是是最常见的单位。 百万…

度量衡计算工具_度量衡计量单位换算转换器

度量衡计量单位换算转换器是一款功能强大的国内外计量单位相互快速换算软件。内容包括:长度转换换算器,功、能和热量转换换算器,功率计量单位换算器,面积转换换算器,体积和容量计量单位换算器,温度转换换算器,压力计量单位换算器,重量转换换算器等。 转换功能: 长度…

分辨率单位及换算

分辨率单位及换算 文章来源 对于测试数字成像设备非常重要的参数是分辨率。但有不同的方式来表达数码相机的分辨率,有时令人困惑。下面介绍的是是最常见的单位。 百万像素 “这台相机有1000万像素的分辨率”是我们经常在广告上看到的数据,但是从技术上看…

单位换算公式

字节: 1字节(Byte)8位(bit) 1KB( Kilobyte,千字节)1024B 1MB( Megabyte,兆字节)1024KB 1GB( Gigabyte,吉字节,千兆)1024MB 1TB( Trillionbyte,万亿字节,太字节)1024GB 1PB( Petabyte&…

迅捷PDF在线转换器将视频在线转换

视频有很多种不同的格式,我们需要将视频转换成其他不同格式的,怎么进行在线转换的呢?下面就让小编简单给大家介绍一下。 步骤一:视频文件在线转换的方法很简单,直接进入到迅捷PDF在线转换器的网站中,找到导…

实用的视频转换工具:转换速度快,格式多,批量转换

视频太多,如何剪辑?比如快速转换多个视频的格式,该如何操作呢?不知道怎么办的宝贝们,下面请随小编一起来试试吧。 所需工具 视频素材若干 操作步骤 运行【视频剪辑高手】,进入主界面,就是转换…