Ollama部署700亿参数大模型Llama3

embedded/2024/10/21 19:20:00/

Ollama部署700亿参数大模型Llama3

  • 前言
  • 一、安装Ollama
  • 二、运行Llama3:70b


前言

首先,70b表示700亿参数,模型文件就有40G,一般的电脑是运行不了的,所以GPU
私有化部署大模型最佳解决方案 Ollama (8B)模型

Meta发布了Llama 3开源模型,分80亿和700亿参数两种版本,宣布超越了闭源的谷歌等模型。网上关于大模型开源闭源讨论也很多,近日一家国外AI智能体公司VRSEN 创始人公开发表言论,表示自己运行开源模型并不如使用商业API那么高效,只有少数公司才能在生产中使用最大的Llama版本。

llama_13">一、安装Ollama

  1. 使用以下脚本安装ollama,但是网速慢
curl -fsSL https://ollama.com/install.sh | sh

我建议本地下载:

  1. 本地先下载 https://ollama.com/download/ollama-linux-amd64

  2. 然后上传ollama-linux-amd64文件

  3. 然后执行以下命令

cp ollama-linux-amd64 /usr/bin/ollama
sudo chmod +x /usr/bin/ollama

二、运行Llama3:70b

修改环境变量


export OLLAMA_MODELS=/root/autodl-tmp/ollama/models

启动ollama server:

ollama serve

新开一个窗口:

ollama run llama3:70b

在这里插入图片描述


http://www.ppmy.cn/embedded/129342.html

相关文章

GEE Python:利用Python API实现Sentinel-1、2和Landsat-8、9的可用影像数量

目录 简介 参数 Python代码 Python内置函数 简介 生成以下卫星图像集合的可用性图表: 1. 哨兵-1 2. 哨兵-2 3. Landsat-8 4. Landsat-9 参数 startDate(开始日期 图像集合的开始日期。格式为 YYYY-MM-DD endDate:结束日期: 图像集的结束日期。格式: YYYY-MM-DD 年-月…

Qt 窗口悬停事件和鼠标跟踪

悬停事件 //这行代码用于启用窗口部件(widget)的悬停事件跟踪功能。 setAttribute(Qt::WA_Hover, true); 作用 setAttribute(Qt::WA_Hover, true); 这行代码的作用是设置窗口部件的一个属性标志,使其能够接收悬停事件(hover eve…

git clone报错fatal: pack has bad object at offset 186137397: inflate returned 1

逐步拷贝 https://stackoverflow.com/questions/27653116/git-fatal-pack-has-bad-object-at-offset-x-inflate-returned-5 https://www.cnblogs.com/Lenbrother/p/17726195.html https://cloud.tencent.com/developer/ask/sof/107092182 git clone --depth 1 <repository…

firewalld 防火墙常用命令

开启 firewalld systemctl start firewalld查看 firewalld 状态 systemctl status firewalldsystemctl status firewalld开启&#xff1a; 开放端口&#xff08;示例开放 80 端口&#xff09; firewall-cmd --zonepublic --add-port80/tcpfirewall-cmd --zonepublic --add…

嵌入式技术:熟悉开发环境及GPIO编程(实验报告)

1.实验目的 &#xff08;1&#xff09;理解GPIO常用函数功能 &#xff08;2&#xff09;掌握GPIO构件的输出测试方法 2.实验原理&#xff08;简述GPIO工作原理&#xff0c;5分&#xff09; GPIO&#xff0c;即通用输入输出端口&#xff0c;是单片机等微控制器上的一种基本接…

[论文笔记]RA-DIT: RETRIEVAL-AUGMENTED DUAL INSTRUCTION TUNING

引言 今天带来一篇RAG微调的论文笔记——RA-DIT: RETRIEVAL-AUGMENTED DUAL INSTRUCTION TUNING。 为了简单&#xff0c;下文中以翻译的口吻记录&#xff0c;比如替换"作者"为"我们"。 我们引入了检索增强双指令微调(Retrieval-Agumented Dual Instructio…

CTFHUB技能树之SQL——时间盲注

开启靶场&#xff0c;打开链接&#xff1a; 说明这关对所有信息都做了统一输出&#xff0c;换成延时注入试试 输入&#xff1a; 1 and sleep(15) &#xff08;这里不知道为什么加上--倒是会影响sleep()函数的触发&#xff0c;从而没有延时感&#xff09; 可以观察到有明显的延…

中级注册安全工程师《安全生产法律法规》真题及详解

2022年中级注册安全工程师《安全生产法律法规》真题及详解 一、单项选择题 &#xff08;共70题&#xff0c;每题1分。每题的备选项中&#xff0c;只有1个最符合题意&#xff09; 1. 法律的制定主体不同&#xff0c;其法律地位和法律效力也不同。关于法律地位和效力的说法&…