LightRAG测试BUG

news/2024/12/13 15:52:44/

错误一:

LightRAG无法回答错误:

INFO:lightrag:kw_prompt result:{{"high_level_keywords": ["xxx", "xxx"],"low_level_keywords": ["xxx", "xxx", "xxx"]
}}
JSON parsing error: Expecting property name enclosed in double quotes: line 1 column 2 (char 1) {{"high_level_keywords": ["xxx", "xxx"],"low_level_keywords": ["xxx", "xxx", "xxx"]
}}
Sorry, I'm not able to provide an answer to that question.

是因为LLM响应的格式错误:

{{"high_level_keywords": ["xxx", "xxx"],"low_level_keywords": ["xxx", "xxx", ]
}}

正确格式:

{"high_level_keywords": ["xxx", "xxx"],"low_level_keywords": ["xxx", "xxx"]
}

解决方法:修改\lightrag\operate.py 477行代码。

python">result = await use_model_func(kw_prompt, keyword_extraction=True)
logger.info("kw_prompt result:")
print("original result:", result)
result = result.replace('{{', '{').replace('}}', '}')
print("rewrite result", result)

错误二:

新环境测试LightRAG时突然出现错误:KeyError: 'Could not automatically map gpt-4o-mini to a tokeniser. Please use `tiktok.get_encoding` to explicitly get the tokeniser you expect.'

解决方法:搜索发现可能跟tiktoken版本问题有关,发现新环境中的tiktoken库版本是0.3.0,而旧环境是0.7.0,重新安装后即可正常运行。
pip install tiktoken==0.7.0

生成的知识图谱中带有很多英文节点:
将\lightrag\prompt.py中PROMPTS[“DEFAULT_LANGUAGE”] 的值修改成 “Chinese”。

错误三:

使用API插入文本出错
官方测试curl命令(错误):curl -X POST "http://127.0.0.1:8020/insert_file" -H "Content-Type: application/json" -d '{"file_path": "path/to/your/file.txt"}'

返回错误:{"detail":[{"type":"missing","loc":["body","file"],"msg":"Field required","input":null}]}

正确curl命令:curl -X POST "http://127.0.0.1:8020/insert_file" -H "Content-Type: multipart/form-data" -F "file=@path/to/your/file.txt"

返回成功:{"status":"success","data":null,"message":"File content from test.txt inserted successfully"}


http://www.ppmy.cn/news/1554794.html

相关文章

24.DDD与敏捷开发

学习视频来源:DDD独家秘籍视频合集 https://space.bilibili.com/24690212/channel/collectiondetail?sid1940048&ctype0 文章目录 DDD与敏捷开发的关系敏捷宣言DDD与敏捷开发相互助力1. 都强调人与人的协作2. 都强调迭代 DDD与敏捷开发的关系 DDD与敏捷开发不…

访问者模式的理解和实践

在软件开发过程中,设计模式为我们提供了解决常见问题的最佳实践。访问者模式(Visitor Pattern)是行为设计模式之一,它将数据操作与数据结构分离,使得在不修改数据结构的前提下,能够定义作用于这些元素的新的…

MySQL生产环境备份脚本

全量备份脚本,其中BakDir,ZlbakDir,LogFile需要自己创建 #!/bin/bash export LANGen_US.UTF-8# 指定备份目录 BakDir/root/beifen/data/mysqlbak/data/allbak # 指定增量备份目录 ZlbakDir/root/beifen/data/mysqlbak/data/zlbak # 备份日志…

外卖开发(八)—— SpringTask(定时任务) 和 WebSocket网络协议

外卖开发(八)—— SpringTask 和 WebSocket 一、利用SpringTask完成定时任务1、cron表达式2、springtask实现 二、使用webSocket实现接单、催单提醒1、代码分析2、催单提醒 一、利用SpringTask完成定时任务 Spring Task是Spring框架提供的任务调度工具&…

Python中的 `string.Template`:用法和使用场景

Python中的 `string.Template`:用法和使用场景 什么是 `string.Template`?`Template` 的基本用法代码解析使用 `safe_substitute`实用场景1. 动态生成消息2. 生成文件内容如何处理复杂场景?总结在Python中,字符串处理是非常常见的任务,其中string.Template提供了一种简单、…

虚拟机网络部署固化IP

有时我们发现在重启虚拟机后,Linux连接不上了,查看原来是IP变了,这是由于IP没有固化导致,所以要先固化ip。 配置网络环境: 1. 关闭防火墙 ( 重要 ) 1:查看防火状态 systemctl status firewa…

InternVL 2.5 介绍

InternVL 2.5 摘要:我们引入了 InternVL 2.5,这是一个先进的多模态大语言模型(MLLM)系列。它建立在 InternVL 2.0 的基础之上,保留了其核心模型架构,同时在训练和测试策略以及数据质量方面引入了重大改进。…

计算机视觉与医学的结合:推动医学领域研究的新机遇

目录 引言医学领域面临的发文难题计算机视觉与医学的结合:发展趋势计算机视觉结合医学的研究方向高区位参考文章结语 引言 计算机视觉(Computer Vision, CV)技术作为人工智能的重要分支,已经在多个领域取得了显著的应用成果&…