在信息爆炸的时代,高效管理和利用个人知识变得愈发重要。GitHub 上的 Khoj 项目为我们提供了一个强大的解决方案,它能成为你的 “AI 第二大脑”,帮你轻松整合、搜索和运用知识。今天,就来详细了解下 Khoj。
Khoj 是什么,能做什么?
Khoj 是一个开源的个人 AI 项目,旨在通过创建始终在线的智能代理来扩展用户的能力。它具备以下强大功能:
- 多源数据整合:能理解并整合多种格式的文件,像 PDF、Markdown、纯文本、GitHub 和 Notion 文件等不在话下,还能将这些本地文档数据与在线信息相结合。例如,你在写一篇工作汇报,它可以同时从你本地的项目文档和网络上的行业资料中获取信息,为你提供全面的参考。
- 自然语言处理:借助先进的自然语言处理技术,Khoj 可以理解用户的各种问题,并给出相关建议和答案。你不用再费力组织复杂的关键词搜索,直接用日常语言提问,它就能精准理解你的需求,比如问 “上个月我们部门销售业绩突出的原因有哪些”,它能迅速给出分析结果。
- 离线优先设计:考虑到网络状况可能不佳,Khoj 采用离线优先原则,在没有网络或者网络信号弱时,依然可以正常工作,保证你随时都能获取所需信息,不耽误任何事情。
- 自托管支持:对于注重数据隐私的用户来说,Khoj 允许你在自己的服务器上自行托管。这样一来,你的数据完全由自己掌控,不用担心隐私泄露问题,还可以根据自身需求定制知识管理系统。
- 多平台访问:提供了丰富的访问方式,支持从桌面应用程序、Emacs 编辑器、Obsidian,到移动应用程序、网络平台,甚至通过 WhatsApp 都能操作。不管你是在办公室办公,还是外出途中,都能随时随地便捷地使用 Khoj。
- 模型集成:你既可以选择集成在线 AI 模型,如 GPT-4,也能部署私有的本地大型语言模型,像 Llama3 等,以此提高搜索和回答的准确性,灵活满足不同场景下的需求。
如何使用 Khoj
官网使用
你可以直接通过官网便捷地使用 Khoj。打开浏览器,访问 Khoj 官网https://khoj.dev/ 。进入官网后,简洁直观的界面会引导你快速上手。在首页,通常会有清晰的提示,指导你如何进行数据添加、提问等操作。例如,在数据添加部分,你能找到上传本地文档(如 PDF、Markdown 等格式)的入口,也能链接到你的 GitHub、Notion 等账户,同步相关数据。提问时,在搜索框输入自然语言问题,比如 “去年的年度总结文档内容要点是什么”,系统会快速在你已添加的数据中搜索,并呈现出相关结果,包括文档片段、相关链接等,就像在本地部署使用一样方便。
本地下载安装
Khoj 的下载和安装有多种方式,这里介绍常见的两种:
- 通过 GitHub 克隆:
- 首先,确保你已经安装了 Git 工具。如果没有安装,可以从Git 官网下载并安装,根据操作系统选择对应的版本,按照提示完成安装步骤。
- 打开命令行终端,进入你想要存放项目的目录。例如,你想把项目放在桌面上的 “khoj_project” 文件夹中,先在命令行输入cd C:\Users\你的用户名\Desktop\khoj_project(Windows 系统)或者cd ~/Desktop/khoj_project(Mac 系统)。
- 使用 Docker 部署(如果你熟悉 Docker):
- 安装 Docker,根据你的操作系统,从Docker 官网下载并安装 Docker Desktop,安装过程中按照默认设置即可,安装完成后启动 Docker。
- 下载完成后,通过docker run -p 8000:8000 khojai/khoj命令运行 Khoj 容器,其中-p 8000:8000表示将容器内的 8000 端口映射到本地的 8000 端口,你可以根据实际情况修改端口号。
简单使用教程
- 首次设置:
- 如果你是通过 GitHub 克隆的项目,进入项目目录,例如cd C:\Users\你的用户名\Desktop\khoj_project\khoj(Windows 系统)或者cd ~/Desktop/khoj_project/khoj(Mac 系统)。
- 安装项目依赖,根据 Khoj 项目文档中的说明,通常使用
命令来安装所需的 Python 库。pip install -r requirements.txt
- 运行 Khoj,输入python khoj/app.py命令启动程序。如果一切正常,你可以在浏览器中访问http://localhost:8000(如果之前修改了端口号,这里也要相应修改),进入 Khoj 的用户界面。
- 添加和管理数据:
- 在 Khoj 的用户界面中,找到 “添加数据” 或类似功能入口,你可以上传本地的文档,如 PDF、Markdown 文件等,也可以连接你的 GitHub 仓库、Notion 账户等,让 Khoj 获取更多数据。
- 对上传的数据进行分类、标记等操作,方便后续搜索和管理,比如你可以将工作相关的文档标记为 “工作”,学习资料标记为 “学习”。
- 提问与获取答案:
- 在搜索框中输入你的问题,用自然语言表达即可,例如 “我去年写的关于市场分析的文档在哪里” 或者 “最新的行业报告中有哪些关键信息”。
- Khoj 会快速分析你的问题,在你添加的数据以及联网信息(如果有设置联网搜索)中进行搜索,然后将相关结果呈现给你,可能包括具体的文档内容、相关链接等。