【Python自然语言处理+tkinter图形化界面】实现智能医疗客服问答机器人实战(附源码、数据集、演示 超详细)

news/2024/10/23 6:24:52/

需要源码和数据集请点赞关注收藏后评论区留言私信~~~

一、问答智能客服简介

QA问答是Question-and-Answer的缩写,根据用户提出的问题检索答案,并用用户可以理解的自然语言回答用户,问答型客服注重一问一答处理,侧重知识的推理。

从应用领域视角,可将问答系统分为限定域问答系统和开放域问答系统。

根据支持问答系统产生答案的文档库、知识库,以及实现的技术分类,可分为自然语言的数据库问答系统、对话式问答系统、阅读理解系统、基于常用问题集的问答系统、基于知识库的问答系统等。

智能问答客服功能架构

典型的问答系统包含问题输入 问题理解 信息检索 信息抽取 答案排序 答案生成和结果输出等,首先由用户提出问题,检索操作通过在知识库中查询得到相关信息,并依据特定规则从提取到的信息中抽取相应的候选答案特征向量,最后筛选候选答案结果输出给用户 

 智能问答客服框架

1: 问题处理 问题处理流程识别问题中包含的信息,判断问题的主题信息和主题范畴归属,比如是属于一般类问题还是属于特定主题类问题,然后提取与主题相关的关键信息,比如人物信息、地点信息和时间信息等。

2 :问题映射 根据用户咨询的问题,进行问题映射消除歧义。通过字符串相似度匹配和同义词表等解决映射问题,根据需要执行拆分和合并操作。

3 :查询构建 通过对输入问题进行处理,将问题转化为计算机可以理解的查询语言,然后查询知识图谱或者数据库,通过检索获得相应备选答案。

4 :知识推理 根据问题属性进行推理,问题基本属性如果属于知识图谱或者数据库中的已知定义信息,则可以从知识图谱或者数据库中查找,直接返回答案。如果问题属性是未定义类问题,则需要通过机器算法推理生成答案。

5: 消岐排序 根据知识图谱中查询返回的一个或者多个备选答案,结合问题属性进行消歧处理和优先级排序,输出最佳答案。

二、智能医疗客服问答实战

定制性智能客服程序一般需要实现选择语料库,去除噪声信息后 根据算法对预料进行训练,最后提供人机接口问答对话,基于互联网获得的医学语料库,并通过余弦相似度基本原理,设计并开发以下问答型智能医疗客服应用程序

项目结构如下 

效果展示 

下面是csv文件中定义的一些病例

预先定义好的欢迎语句 

 

 

运行chatrobot文件  弹出以下窗口 输出问题后点击提交咨询即可  

 

对于语料库中没有的问题会自动推断给出答案(通常不太准确) 

 

 

 三、代码

部分代码如下 全部代码和数据集请点赞关注收藏后评论区留言私信

# -*- coding:utf-8 -*-
from fuzzywuzzy import fuzz
import sys
import jieba
import csv
import pickle
print(sys.getdefaultencoding())import logging
from fuzzywuzzy import fuzz
import math
from scipy import sparse
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.feature_extraction.text import TfidfTransformer
from scipy.sparse import lil_matrix
from sklearn.naive_bayes import MultinomialNB
import warnings
from tkinter import *
import time
import difflib
from collections import Counter
import numpy as npfilename = 'label.csv'def tokenization(filename):corpus = []label = []question = []answer = []with open(filename, 'r', encoding="utf-8") as f:data_corpus = csv.reader(f)next(data_corpus)for words in data_corpus:word = jieba.cut(words[1])tmp = ''for x in word:tmp += xcorpus.append(tmp)question.append(words[1])label.append(words[0])answer.append(words[2])with open('corpus.h5','wb') as f:pickle.dump(corpus,f)with open('label.h5','wb') as f:pickle.dump(label,f)with open('question.h5', 'wb') as f:pickle.dump(question, f)with open('answer.h5', 'wb') as f:pickle.dump(answer, f)return corpus,label,question,answerdef train_model():with open('corpus.h5','rb') as f_corpus:corpus = pickle.load(f_corpus)with open('label.h5','rb') as f_label:label = pickle.load(f_label,encoding='bytes')vectorizer = CountVectorizer(min_df=1)transformer = TfidfTransformer()tfidf = transformer.fit_transform(vectorizer.fit_transform(corpus))words_frequency = vectorizer.fit_transform(corpus)word = vectorizer.get_feature_names()saved = tfidf_calculate(vectorizer.vocabulary_,sparse.csc_matrix(words_frequency),len(corpus))model = MultinomialNB()model.fit(tfidf,label)with open('model.h5','wb') as f_model:pickle.dump(model,f_model)with open('idf.h5','wb') as f_idf:pickle.dump(saved,f_idf)return model,tfidf,labelclass tfidf_calculate(object):def __init__(self,feature_index,frequency,docs):self.feature_index = feature_indexself.frequency = frequencyself.docs = docsself.len = len(feature_index)def key_count(self,input_words):keys = jieba.cut(input_words)count = {}for key in keys:num = count.get(key, 0)count[key] = num + 1return countdef getTfidf(self,input_words):count = self.key_count(input_words)result = lil_matrix((1, self.len))frequency = sparse.csc_matrix(self.frequency)for x in count:word = self.feature_index.get(x)if word != None and word>=0:word_frequency = frequency.getcol(word)feature_docs = word_frequency.sum()tfidf = count.get(x) * (math.log((self.docs+1) / (feature_docs+1))+1)result[0, word] = tfidfreturn result    if __name__=="__main__":tokenization(filename)train_model()

创作不易 觉得有帮助请点赞关注收藏~~~


http://www.ppmy.cn/news/574868.html

相关文章

月近万次发布,故障率<4‰如何做到?去哪儿测试左移重难点揭秘!

一分钟精华速览 去哪儿发布的数据显示,在过去一年中,其发布故障率始终保持在 4‰ 以下并不断降低。作为一家出行旅游服务平台,去哪儿网如何在复杂的业务场景下,仍能保持如此低的故障率?其中功能测试左移功不可没。 本…

一个很久的故事

一转眼,5年又过去了.过去,认为时间就能冲淡一切,如今还是一样 生活到底存在着什么样的含义,我不懂!习惯伪装自己的我,真的好累但你不懂~ 记得从2003年开始,我做什么事情都是失败的,在我背后没有人支持自己,孤孤单单的走到了现在! 记得在每一次的失败后,自己都学会了自己去安慰自…

python 调试方法总结

说在前面 我觉得没有什么错误是调试器无法解决的,如果没有,那我再说一遍,如果有,那当我没说 一、抛出异常 可以通过 raise 语句抛出异常,使程序在我们已经知道的缺陷处停下,并进入到 except 语句   ra…

神舟电脑上的神器----“control center 管理软件”

前言: 现在有许许多多的人都爱上了神舟电脑的“物美价廉”,那么在使用神舟电脑的时候,我们有哪些值得知道的事情?我认为用神舟电脑而不知道,神舟电脑上的控制中心“control center 管理软件”,将没有比这个…

QT6之多线程控制——互斥量和信号量

在程序中,通常竞争使用临界资源,但如果不加限制就很可能出现异常或未达到预期的结果。 临界资源一次仅允许被一个线程使用,它可以是一块内存、一个数据结构、一个文件或者任何其他具有排他性使用的东西。 这些必须互斥执行的代码段称为“临界区(Critical…

神舟战神Z8-CU7NA折腾Windows10 + Manjaro双系统

前言: 此博文是笔者折腾笔记, 同时贡献给爱折腾的Linuxer, 笔者使用过Ubuntu, 红帽RHEL, CentOS, Fedora, Manjaro(按时间先后顺序), 我个人觉得好用性一个比一个强. 另外①操作系统而言看需求和个人喜好, 用Windows还是Linux或者MacOS没有什么好争辩的, ②Linuxer用图形操作还…

神舟测试软件,神舟战神P5常规性能软件测试_神舟 战神P5-i78172D1_笔记本评测-中关村在线...

■常规软件测试 ◆CPU-Z: CPU-Z是一款家喻户晓的CPU检测软件,除了使用Intel或AMD自己的检测软件之外,我们平时使用最多的此类软件就数它了。CPU-Z提供一些关於处理器的资讯,包含了制造厂及处理器名称,核心构造及封装技…

在React+ts中集成高德地图(保姆级教程)

前往高德地图开发平台高德开放平台 | 高德地图API 一:申请高德key 去高德官网去创建一个属于自己的地图应用 (得到key和秘钥) 。 首先,我们要注册一个开发者账号,根据实际情况填写,身份写个人:…