使用llama.cpp 在推理MiniCPM-1.2B模型

devtools/2024/9/19 10:03:21/ 标签: llama, C++, llama.cpp

llama.cpp 是一个开源项目,它允许用户在C++中实现与LLaMA(Large Language Model Meta AI)模型的交互。LLaMA模型是由Meta Platforms开发的一种大型语言模型,虽然llama.cpp本身并不包含LLaMA模型的训练代码或模型权重,但它提供了一种方式来加载预先训练好的模型,并使用它们进行文本生成等任务。

特点

  • 轻量级:相比于使用Python和深度学习框架如PyTorch或TensorFlow,llama.cpp是一个纯C++实现,可以更轻松地部署到资源受限的环境中。
  • 独立性:它不需要依赖于复杂的外部库,这使得它在某些情况下更容易集成到现有系统中。
  • 可移植性:由于它是用C++编写的,因此理论上可以在任何支持C++的平台上运行。

使用方法

获取源码

首先,你需要从GitHub获取llama.cpp的源代码:

git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
安装依赖
sudo apt install build-essential ninja-build cmake
编译

然后,你需要编译项目。这通常涉及安装必要的依赖项(如CMake),然后运行编译命令:

cmake -GNinja -Bbuild_ninja
cmake --build build_ninja
下载模型
sudo apt install git git-lfs
git clone https://www.modelscope.cn/OpenBMB/MiniCPM-1B-sft-q4_1-gguf.git
运行示例

一旦编译完成,你可以尝试运行一些控制台示例程序来测试模型的功能。例如,你可以执行一个简单的交互式聊天程序:


build_ninja/bin/llama-cli -m ../MiniCPM-1B-sft-q4_1-gguf/MiniCPM-1B-sft-q4_1.gguf -cnv --chat-template gemma
加载模型

llama.cpp提供了加载预先训练好的模型的方法。你需要将模型文件下载到本地,并通过API指定路径加载模型。

文本生成

使用加载的模型,你可以通过输入提示(prompt)来生成文本。API提供了设置生成参数(如prompt、最大长度等)的方法。

注意事项

虽然llama.cpp提供了一个有趣的方式来使用预训练的语言模型,但在实际应用中还需要注意以下几点:

  • 模型许可:确保你有权合法地使用你想要加载的模型。
  • 性能限制:尽管llama.cpp是为资源受限的环境设计的,但它可能在高性能计算环境中不如专门优化过的框架高效。
  • 维护和支持:考虑到这是一个相对较小的项目,可能没有像大公司支持的框架那样的活跃社区或官方支持。

http://www.ppmy.cn/devtools/114109.html

相关文章

SQL数据库(MySQL)

一、在Ubuntu系统下安装MySQL数据库 1、更新软件源,在确保ubuntu系统能正常上网的情况下执行以下命令 sudo apt-get update 2、安装MySQL数据库及相关软件包 # 安装过程中设置root用户的密码 123456 sudo apt-get install mysql-server ​ # 安装访问数据库的客…

scanf()函数的介绍及基础用法

目录 scanf()函数的介绍及基础用法 一:头文件 二:一般用法 三:返回值 1. 正整数的情况: 2. 0 的情况: 3. EOF的情况: 四:说明 scanf()函数…

IP池对数据爬取工作的帮助

在数据爬取的过程中,IP池(也称为代理IP池)是一个极为重要的工具,它为数据抓取工作提供了多方面的支持和便利。本文将详细探讨IP池在数据爬取工作中的具体作用,以及它如何帮助提升数据抓取的效率、稳定性和合规性。 一…

新手教学系列——基于统一页面的管理后台设计(一)

在现代企业级应用中,后台管理系统往往是核心组成部分,特别是随着业务规模的扩展,如何在多个后端服务模块的基础上实现统一的登录验证、权限控制和页面管理,成为许多开发者面对的挑战。本文将以实际项目为例,详细讲解如何设计一个多模块的后台管理系统,满足不同服务模块的…

部署Prometheus+Grafana批量监控Linux服务器

在 Linux 服务器上使用 Docker 容器快速部署 Prometheus 和 Grafana 监控系统,同时通过 node_exporter 采集全面的系统性能数据。整个流程涵盖了从环境配置到搭建一个全面监控平台的每个步骤。 一键安装Node Exporter Node Exporter 是 Prometheus 生态系统中的一个…

上线跨境电商商城的步骤

上线一个跨境电商商城涉及多个步骤,从前期准备到上线后的维护。以下是一些关键步骤: 1. 市场调研与规划 目标市场分析:研究目标市场的需求、竞争对手和消费者行为。法律法规:了解并遵守目标市场的法律法规,包括税收、…

Unity携程Coroutine用法

一.携程概述 官方的解释是,携程允许你可以在多个帧中执行任务。在Unity中,携程是一个可以暂停并在后续帧中从暂停处继续执行的方法。 二.携程写法 下面示例使用携程和Update打印前5帧的时间间隔,展示了携程的基础写法 using System.Colle…

CentOS 入门必备基础知识

CentOS 是 Linux 发行版之一,基于 Red Hat Enterprise Linux(RHEL),提供免费的企业级操作系统。对于初学者和系统管理员来说,了解 CentOS 的基础知识是必不可少的。本文将带你快速掌握 CentOS 的入门要点,帮…

vue-ts-demo

npm i -g vue/cli PS D:\kwai\vue3\project> vue create vue3-te-demo element-plus 一个 Vue 3 UI 框架 | Element Plus https://element-plus.org/zh-CN/guide/installation.html 安装: npm install element-plus --save 完整引入使用: 使用&…

STM32 芯片启动过程

目录 一、前言二、STM32 的启动模式三、STM32 启动文件分析1、栈 Stack2、堆 Heap3、中断向量表 Vectors3.1 中断响应流程 4、复位程序 Reset_Handler5、中断服务函数6、用户堆栈初始化 四、STM32 启动流程分析1、初始化 SP、PC 及中断向量表2、设置系统时钟3、初始化堆栈并进入…

判断变量是否为有限数字(非无穷大或NaN)math.isfinite() 判断变量是否为无穷大(正无穷大或负无穷大)math.isinf()

【小白从小学Python、C、Java】 【考研初试复试毕业设计】 【Python基础AI数据分析】 判断变量是否为有限数字(非无穷大或NaN) math.isfinite() 判断变量是否为无穷大(正无穷大或负无穷大) math.isinf() 请问关于以下代码表述错误…

qt信号与槽(自定义)

自定义信号与槽 在qt里,我们可以自己去定义信号与槽。 这里举个栗子: 信号的定义 在我们类里边定义一个信号,我们需要用signals:来声明,不用再去cpp文件里边定义。而且返回值必须是void,可以有参数。 槽…

构建自己的文生图工具:Python + Stable Diffusion + CUDA

构建自己的文生图工具:Python Stable Diffusion CUDA 前言概述环境搭建安装PyTorch安装Stable Diffusion编写Python代码结论结语 前言 在这个数字化和人工智能飞速发展的时代,图像生成技术正逐渐成为现实。想象一下,只需输入几个关键词&…

ffmpeg批量图片格式转换

参考别的地方的弄的 echo off::在下方设置要处理的视频或图片 set Ext*.png,*.bmpmd outputecho 开始视频转换::在下方设置输出格式,这里输出为mp4,可自行更改 for %%a in (%Ext%) do (echo 正在转换:%%a"../ffmpeg.exe" -logleve…

驱动开发知识点

裸机开发 ——————————————linux驱动 SOC: 定义:SOC,全称System on Chip,是一种集成了多个功能模块的芯片,包括处理器、内存、外设、接口等。它将原本分散在多个芯片上的功能集成到一个芯片上&#xff0…

Redis 底层数据结构,一文详解

Redis 底层用 C 语言实现,不同版本的数据类型使用的数据结构也不同,下面详细看 SDS 字符串在 Redis 中很常用,键值对的所有键都是字符串,值有时候也是字符串 Redis 是用 C 语言实现的,但是字符串没有直接用 C 语言的…

Photoshop使用方法大全

0、快捷键 1)Alt Delete:填充前景色 2)Ctrl D:取消选区 3)Ctrl T:自由变换,等比缩放、旋转的效果 4)Ctrl R:显示标尺 5)Ctrl J:复制一个…

【LLM多模态】文生视频评测基准VBench

note VBench的16个维度自动化评估指标代码实践(待完成)16个维度的prompt举例人类偏好标注:计算VBench评估结果与人类偏好之间的相关性、用于DPO微调 文章目录 note一、相关背景二、VBench评测基准概述:论文如何解决这个问题&…

算法-排序算法(冒泡选择插入希尔快速归并堆)

1.算法概述 1.1什么是算法 算法是特定问题的求解步骤的描述,是独立存在的一种解决问题的思想和方法。对于算法而言计算机编程语言并不重要,可以用任何计算机编程语言来编写算法。 程序数据结构算法 1.2数据结构和算法的区别和联系 数据结构只是静态…

基于yolov8的文本表格检测系统python源码+onnx模型+评估指标曲线+精美GUI界面

【算法介绍】 YOLOv8,作为YOLO(You Only Look Once)系列的最新版本,于2023年由Ultralytics公司发布,是当前性能卓越的目标检测器之一。它不仅在通用目标检测上表现优异,还被广泛应用于各种视觉AI任务&…