题目
题目描述
人们在英文字典中查找某个单词的时候可能不知道该单词的完整拼法,而只知道该单词的一个错误的近似拼法,这时人们可能陷入困境,为了查找一个单词而浪费大量的时间。带有模糊查询功能的电子字典能够从一定程度上解决这一问题:用户只要输入一个字符串,电子字典就返回与该单词编辑距离最小的几个单词供用户选择。
字符串a与字符串b的编辑距离是指:允许对a或b串进行下列“编辑”操作,将a变为b或b变为a,最少“编辑”次数即为距离。
删除串中某个位置的字母;
添加一个字母到串中某个位置;
替换串中某一位置的一个字母为另一个字母;
JSOI团队正在开发一款电子字典,你需要帮助团队实现一个用于模糊查询功能的计数部件:对于一个待查询字符串,如果它是单词,则返回-1;如果它不是单词,则返回字典中有多少个单词与它的编辑距离为1。
输入格式
第一行包含两个正整数N (N ≤ 10,000)和M (M ≤ 10,000)。
接下来的N行,每行一个字符串,第i + 1行为单词Wi。单词长度在1至20之间。
再接下来M行,每行一个字符串,第i + N + 1表示一个待查字符串Qi。待查字符串长度在1至20之间。Wi和Qi均由小写字母构成,文件中不包含多余空格。所有单词互不相同,但是查询字符串可能有重复。
输出格式
输出应包括M行,第i行为一个整数Xi。Xi = -1表示Qi为字典中的单词;否则Xi表示与Qi编辑距离为1的单词的个数。
输入输出样例
输入 #1 复制
4 3
abcd
abcde
aabc
abced
abcd
abc
abcdd
输出 #1 复制
-1
2
3
说明/提示
abcd在单词表中出现过;abc与单词abcd、aabc的编辑距离都是1;abcdd与单词abcd、abcde、abced的编辑距离都是1。
对50%的数据范围:N<=1,000,M<=1,000
对100%的数据范围:N<=10,000, M<=10,000
思路
先把词典读进去,插入到trie树中
对于每次查询,先判断是否在trie树中
若不在,再进行删除、替换、添加
在对查询串进行处理时比较麻烦
楼上有用dfs的,在这里我是直接暴力模拟
时间没有问题,所有点一共2001ms
废话不多说,上代码
注意:此题通过两种变换方式得到相同的字符串算一个
比如abc在第一位加一个a和第二位加一个a结果都是aabc,但统计是算一个
代码
#include<bits/stdc++.h>
#define il inline
#define rint register int
#define ull unsigned long long
using namespace std;
const int N=1e5+5;const ull B=233;
ull h[N],H[25],S[N],b[25];
int n,m;char s[25];
il int find(ull x){rint l=1,r=n,mid;while(l<=r) (h[mid=l+r>>1]<=x)?l=mid+1:r=mid-1;return h[l-1]==x&&x;
}
int main(){ios::sync_with_stdio(0);b[0]=1;for(rint i=1;i<=21;++i) b[i]=b[i-1]*B;cin>>n>>m;for(rint i=1;i<=n;++i){cin>>s+1;for(rint j=1,lg=strlen(s+1);j<=lg;++j) h[i]=h[i]*B+s[j]-96;}sort(h+1,h+n+1);while(m--){cin>>s+1;rint lg=strlen(s+1),ct=0;S[lg+1]=0;for(rint i=1;i<=lg;++i) H[i]=H[i-1]*B+s[i]-96;for(rint i=lg;i>=1;--i) S[i]=S[i+1]+(s[i]-96)*b[lg-i];if(find(H[lg])){printf("-1\n");continue;}for(rint i=0;i<lg;++i) if(s[i]^s[i+1])if(find(H[i]*b[lg-i-1]+S[i+2])) ++ct;for(rint i=0;i<=lg;++i) for(rint j=1;j<=26;++j) if(j!=s[i]-96)if(find(H[i]*b[lg-i+1]+j*b[lg-i]+S[i+1])) ++ct;for(rint i=1;i<=lg;++i) for(rint j=1;j<=26;++j)if(find(H[lg]+(j-s[i]+96)*b[lg-i])) ++ct;printf("%d\n",ct);}return 0;
}