Ollama使用笔记【更新ing】

news/2025/2/28 13:11:25/

0.引言

本篇以自己的学习轨迹为主,记录有关ollama的技术和理论问题。

llama_3">1.Ollama是什么?

o<a class=llama图标" />
上图为ollama官方logo。Ollama 是一个专注于本地部署大型语言模型的工具,通过提供便捷的模型管理、丰富的预建模型库、跨平台支持以及灵活的自定义选项,使得开发者和研究人员能够在本地环境中高效利用大型语言模型进行各种自然语言处理任务,而无需依赖云服务或复杂的基础设施设置。

llama_8">2.如何选择安装Ollama版本?

macOS和Windows的超级简单,进入官网点击下载等待即可。
重点讲Linux系统。
一般如果没有显卡跑不起来大模型,所以会根据显卡类型判断下载的版本。
(1)如果是A卡(AMD)类型,需要下载ROCm 软件包

curl -L https://ollama.com/download/ollama-linux-amd64-rocm.tgz -o ollama-linux-amd64-rocm.tgz
sudo tar -C /usr -xzf ollama-linux-amd64-rocm.tgz

(2)如果是N卡(NVIDIA)类型,下载amd64.tgz即可

curl -L https://ollama.com/download/ollama-linux-amd64.tgz -o ollama-linux-amd64.tgz
sudo tar -C /usr -xzf ollama-linux-amd64.tgz

(3)如果是ARM64架构的机器,下载特定于 ARM64 的包

curl -L https://ollama.com/download/ollama-linux-arm64.tgz -o ollama-linux-arm64.tgz
sudo tar -C /usr -xzf ollama-linux-arm64.tgz

3.如何判断A卡还是N卡?

A卡全名(AMD)代表GPU芯片是AMD研发的,N卡全名(NVIDIA)他代表GPU是英伟达家研发的。
AMD家的显卡基本上都是以R开头或者是RX开头。例如,以前的R7 370 R9 390。现在AMD家的新显卡基本上都是以RX开头了,例如RX6500 RX6500XT RX6600 RX6600XT RX6750XT RX6800XT RX6900XT RX6950XT。
N卡的开头字母主要有GT GTX RTX三种。GT一般代表入门级显卡比如GT1030,这部分显卡性能不是太好,但是用于点亮电脑或者玩一些小游戏还是没问题的,价格也比较便宜,至于这个GTX和RTX都代表高性能显卡,只不过这个RTX具有光追功能。

llamatoken_36">4.Ollama的token限制在哪里看?

ModelFile文件中参数num_ctx
只有自己导入定制模型,才能设置参数num_ctx

llama_40">5.Ollama如何查看已拉取模型的详细信息?

ollama show deepseek-r1:latest

命令截图


http://www.ppmy.cn/news/1575510.html

相关文章

【Java】多线程和高并发编程(一):线程的基础概念

文章目录 一、线程的基础概念1、基础概念1.1 进程与线程1.2 多线程1.3 串行、并行、并发1.4 同步异步、阻塞非阻塞 2、线程的创建2.1 继承Thread类 重写run方法2.2 实现Runnable接口 重写run方法2.3 实现Callable 重写call方法&#xff0c;配合FutureTask2.4 基于线程池构建线程…

23种设计模式之《外观模式(Facade)》在c#中的应用及理解

程序设计中的主要设计模式通常分为三大类&#xff0c;共23种&#xff1a; 1. 创建型模式&#xff08;Creational Patterns&#xff09; 单例模式&#xff08;Singleton&#xff09;&#xff1a;确保一个类只有一个实例&#xff0c;并提供全局访问点。 工厂方法模式&#xff0…

如何免费使用稳定的deepseek

0、背景&#xff1a; 在AI辅助工作中&#xff0c;除了使用cursor做编程外&#xff0c;使用deepseek R1进行问题分析、数据分析、代码分析效果非常好。现在我经常会去拿行业信息、遇到的问题等去咨询R1&#xff0c;也给了自己不少启示。但是由于官网稳定性很差&#xff0c;很多…

C ++内存管理

1. 内存分区 在 C 里&#xff0c;内存主要分为以下几个区域&#xff1a; 栈&#xff08;Stack&#xff09;&#xff1a;由编译器自动分配和释放&#xff0c;用于存储局部变量、函数参数和返回地址等。其特点是内存分配和释放速度快&#xff0c;遵循后进先出&#xff08;LIFO&am…

C#快捷键的应用

Ctrl键下面的键 // z 撤回 ​ // x 剪切 ​ // c 复制 ​ // v 粘贴 ​ // a 全选 ​ // s 保存 ​ // f 搜索 ​ // h 替换 ​ // y 反撤销&#xff08;撤销过了&#xff09; ​ // 不选中…

利用DeepSeek-Kimi打通Excel与PPT的链条,自动生成数据分析报告

通过DeepSeek在Excel生成结构化的数据分析报告&#xff0c;再借助Kimi的PPT助手将报告自动转换为专业的PPT演示文稿&#xff0c;从而实现从数据到展示的一站式解决方案。 案例数据 1.一键生成数据分析报告 在下载并安装“Excel矩阵”后&#xff0c;我们启用DeepSeek的右侧对话…

HarmonyOS NEXT 原生应用/元服务调试概述

一、概述 DevEco Studio提供了丰富的HarmonyOS应用/元服务调试能力&#xff0c;支持JS、ArkTS、C/C单语言调试和ArkTS/JSC/C跨语言调试能力&#xff0c;并且支持三方库源码调试&#xff0c;帮助开发者更方便、高效地调试应用/元服务。 HarmonyOS应用/元服务调试支持使用真机设备…

SOME/IP-SD -- 协议英文原文讲解4

前言 SOME/IP协议越来越多的用于汽车电子行业中&#xff0c;关于协议详细完全的中文资料却没有&#xff0c;所以我将结合工作经验并对照英文原版协议做一系列的文章。基本分三大块&#xff1a; 1. SOME/IP协议讲解 2. SOME/IP-SD协议讲解 3. python/C举例调试讲解 5.1.2.4.5…