【编程日常】window下玩llama遇到的问题

ops/2024/9/18 12:41:36/ 标签: llama

llama_0">window下玩llama遇到的问题

  1. 安装llama客户端
    首先,从官网下载 llama,安装 Ollama 客户端
    下载地址:https://ollama.com/download/windows
    下载完成之后点击安装;
  2. 下载模型文件
    打开 windows powershell 或 CMD 命令行终端,输入 ollama 命令,回车,即可显示 ollama 命令的使用帮助
    在这里插入图片描述
    在命令行中输入如下命令,即可在线拉取模型。

ollama run llama3.1:8b
如果您的显卡非常好,其他两个模型的拉取命令如下 :
ollama run llama3.1:70b
ollama run llama3.1:405b

更多模型支持

当然 ollama 不仅支持运行 llama3.1,实际上他支持更多的开源模型,详细教程见官方文档:模型库

手动导入模型

如果您的网络情况不太好,在线下载模型进度缓存,官方也支持从其他渠道下载好的模型导入。
详细参考导入模型,这里不做赘述。

模型下载好之后,就可以进行对话了。

  1. 配置远程访问

Ollama 启动的默认地址为http://127.0.0.1:11434,我们通过设置环境变量 OLLAMA_HOST来修改默认监听地址和端口,这往往对我们需要远程调用API时非常有用。同时,如果要在open-webui等UI面板中调用 API ,需要为 Ollama 进行跨域配置后方可正常使用。

需要了解如下三个变量的用途

变量名说明
OLLAMA_HOST0.0.0.0:8888用于配置监听的 IP 和端口
OLLAMA_ORIGINS*支持跨域访问,也可以指定特定域名,如:“baidu.com,hello.com”
OLLAMA_MODELSC:\Users\Administrator.ollama模型文件较大,建议调整到数据盘目录下。

3.1 API 调用

curl -X POST http://localhost:11434/api/generate -H "Content-Type: application/json" -d "{\"model\":\"llama3.1:8b\",\"prompt\":\"You are a professional, authentic translation engine. You only return the translated text, without any explanations.\"}"Invoke-WebRequest http://localhost:11434/api/generate -Method POST -Body '{ "model": "llama3.1:8b" , "prompt": "Why is the sky blue?"}'Invoke-WebRequest http://localhost:11434/api/generate -Method POST -Body '{ "model": "llama3.1:8b" , "prompt": "Why is the sky blue?", "options": { "num_ctx": 4096 } }'

reference

@article{xn–bxy.xn–wxt.xn–5kv.xn–230a.xn–9kq.2024Aug,
author = {xn–bxy. xn–wxt. xn–5kv. xn–230a. xn–9kq.},
title = {{xn–OllamaLlama-vd2r931f1e5cd33bmo8aeb3d 3.xn–1-mn0b92cy20b}},
journal = {SegmentFault xn–3qr51z},
year = {2024},
month = aug,
publisher = {SegmentFault},
url = {https://segmentfault.com/a/1190000045123889}
}


http://www.ppmy.cn/ops/102670.html

相关文章

音视频入门基础:WAV专题(7)——FFmpeg源码中计算WAV音频文件每个packet的size值的实现

一、引言 从文章《音视频入门基础:WAV专题(6)——通过FFprobe显示WAV音频文件每个数据包的信息》中我们可以知道,通过FFprobe命令可以显示WAV音频文件每个packet(也称为数据包或多媒体包)的信息&#xff0…

谷歌chrome浏览器显示“版本太旧”又无法更新情况下,如何关闭“Chrome版本太旧”提示,包括直接启动Google浏览器,或者通过其他应用启动

问题描述 由于在无互联网环境使用Google浏览器,所以无法进行升级,但每次启动都会有如下提示,作为有强迫症的我实在无法接受。 解决方案 1、修改属性(通过快捷方式启动有效) 通过右键在快捷方式后添加启动参数 右键“Google Chrome”图标…

揭秘SQL注入漏洞:为何它成为攻击者的首选?

自Web应用程序开始广泛使用数据库以来,SQL注入漏洞便因其隐蔽性强、潜在危害巨大以及实施门槛相对较低等特性,成为了网络攻击者频繁利用的安全弱点之一。尽管这一漏洞已经存在多年,它仍然是企业组织在数字化转型过程中面临的最为普遍且危险的…

Java(若依):Map导出

Controller /*** 导出* param response* param lssjcx*/ PostMapping("/export") public void export(HttpServletResponse response, User user){List<Map<String, Object>> resMap userMapper.list(user);ExcelUtilT utilT new ExcelUtilT();utilT.…

http应用层协议

一、万维网 用来存放各种资源的网络。 1、如何在万维网中表示一个资源 ? url ——统一资源定位符&#xff1b; 形式&#xff1a; <协议>://<主机>:<端口>/<路径>&#xff1b; <主机>:<端口>/<路径> //表示了资源所在的…

深入理解WebSocket:从基础到实践

深入理解WebSocket&#xff1a;从基础到实践 WebSocket是现代网络通信中一个重要的技术&#xff0c;它在单个TCP连接上实现了全双工通信&#xff0c;使得实时、双向数据传输成为可能。与传统的HTTP协议相比&#xff0c;WebSocket提供了更高效的实时数据交换方式。本文将深入探…

C++语法基础(一)

第一个C程序 1. <iostream>&#xff08;C&#xff09; <iostream> 是 C 标准库中的头文件&#xff0c;用于处理输入输出操作。它提供了基于流&#xff08;stream&#xff09;的输入输出机制。 特点&#xff1a; 面向对象&#xff1a;C 中的输入输出操作是基于流…

石碑文字全排列重组(华为od机考题)

一、题目 1.原题 有一个考古学家发现一个石碑&#xff0c; 但是很可惜&#xff0c;发现时其已经断成多段&#xff0c; 原地发现n个断口整齐的石碑碎片。 为了破解石碑内容&#xff0c; 考古学家希望有程序能帮忙计算复原后的石碑文字组合数&#xff0c; 你能帮忙吗&#xff1…

catkin_ws的作用

catkin_ws在ROS&#xff08;Robot Operating System&#xff0c;机器人操作系统&#xff09;中扮演着重要的角色&#xff0c;它是ROS用户的工作空间&#xff0c;主要用于存放与ROS项目相关的开发文件。catkin_ws的作用主要体现在以下几个方面&#xff1a; 组织结构化&#xff…

想学gis开发,java和c++哪个比较好?

java与C的应用场景不同&#xff0c;究竟选择谁&#xff0c;应该由开发者的兴趣方向来决定。 你选择Java&#xff0c;意味着以后的业务方向就是偏后台服务开发&#xff0c;如果你非得说我用java也可以写界面&#xff0c;对不起&#xff0c;别人不会。不管是从项目还是产品的角度…

【C++】new和定位new

文章目录 C中的new关键字与定位new1. 什么是new关键字&#xff1f;2. new关键字的内存管理3. 定位new&#xff08;Placement New&#xff09;3.1 定位new的语法3.2 适用场景 4. 定位new的析构与内存释放 C中的new关键字与定位new 在C中&#xff0c;内存管理是一个非常重要的概…

STL容器中 list(双向链表)的增删改查

list&#xff08;双向链表&#xff09; std::list 是 C 标准模板库&#xff08;STL&#xff09;中的一个容器&#xff0c;它实现了一个双向链表。双向链表中的每个元素都包含三个部分&#xff1a;存储数据的元素本身、指向前一个元素的指针&#xff08;或迭代器&#xff09;、…

vs2019 C++ 无法定位程序输入点于动态链接库

问题 一个项目一段时间没运行后&#xff0c;再运行报以下错误&#xff1a; 无法定位程序输入点??0lnferenceEngineExceptiondetailslnferenceEngine QEAAAEBV? b a s i c s t r i n g D U ? basic stringDU? basicstringDU?char traitsDstd v?$allocatorD2 stdHOZ 于动…

Java基础(多态)

目录 一、什么是多态 二、多态实现的必要条件 三、多态的特点 四、引用类型转换 五、通过一个题目来分析多态的使用 后言 一、什么是多态 多态是同一个行为具有多个不同的表现形式或形态的能力 二、多态实现的必要条件 在多态中必须存在有继承或实现关系的子类和父类子…

Element Plus 的 ColorPicker 颜色选择器:定制按钮

截止至 饿了么 Element Plus 2.8.1版本的组件库&#xff0c;color picker组件不支持自定义颜色选择弹窗里的按钮&#xff01;&#xff01;&#xff01;只好另辟蹊径解决这个问题。 <template><div class"color_box flex between"><el-color-pickerre…

5G无线电链路监控(Radio Link Monitoring,简称RLM)

5G支持在无线电链路监控&#xff08;Radio Link Monitoring&#xff0c;简称RLM&#xff09;上的应用。 首先&#xff0c;我们来理解什么是RLM。在移动通信中&#xff0c;无线电链路监控&#xff08;RLM&#xff09;是一个关键功能&#xff0c;它负责监测和评估无线链路的状况。…

XML 数据格式介绍及其应用

由于篇幅限制&#xff0c;我将提供一个较为精简的介绍&#xff0c;覆盖XML数据格式的基础知识、应用领域以及与Python数据类型的关系等内容。 XML 数据格式介绍及其应用 XML (eXtensible Markup Language) 是一种标记语言&#xff0c;用于定义数据的结构和含义。与 HTML 相比…

IoT客户端+联邦学习微调大模型

大型模型的训练涉及到微调&#xff0c;微调则面临着高质量数据的稀缺性。与基于集中式数据中心的解决方案相比&#xff0c;物联网-IoT中大型模型的更新面临着分布式客户端私有且异构数据的协调挑战。为了解决这一挑战&#xff0c;作者提出了KOALA来推动物联网中大模型的训练。由…

游卡,三七互娱,得物,顺丰,快手,oppo,莉莉丝,埃科光电,康冠科技,途游游戏25秋招内推

游卡&#xff0c;三七互娱&#xff0c;得物&#xff0c;顺丰&#xff0c;快手&#xff0c;oppo&#xff0c;莉莉丝&#xff0c;埃科光电&#xff0c;康冠科技&#xff0c;途游游戏25秋招内推 ①顺丰 【招聘岗位】研发、算法、大数据、产品、项管、设计、人资等 【官方内推码】4…

Qt 线程与窗体之间的传值

QThread 和窗口之间的通信通常通过信号和槽机制来实现 也可以直接通过调用线程中的值 效果图(Dialog To hello; TextLabel To hello) 在主窗口类中创建线程实例&#xff0c;并连接线程发出的信号到主窗口的槽函数。 .h #ifndef TESTAPP_H #define TESTAPP_H#include <QD…