用 llama.cpp 体验 Meta 的 Llama AI 模型

用 llama.cpp 体验 Meta 的 Llama AI 模型

news/2024/11/30 3:15:33/

继续体验 Meta 开源的 Llama 模型，前篇试用 Llama-3.1-8B-Instruct AI 模型直接用 Python 的 Tranformers 和 PyTorch 库加载 Llama 模型进行推理。模型训练出来的精度是 float32, 加载时采用的精度是 torch.bfloat16。

注：数据类型 torch.float32, torch.bfloat16, 与 torch.float16 有不同的指数(Exponent)，尾数(Fraction)宽度, 它们都有一位是符号位，所以剩下的分别为指数位和尾数位宽度, torch.float32(8, 23), torch.bfloat16(8, 7), torch.float16(5, 10)。

模型依赖于 GPU 的显存，根据经验, 采用 16 位浮点数加载模型的话，推理所需显存大小(以 GB 为单) 是模型参数量(以 10 亿计) 的两倍，如 3B 模型需要约 6G 显存。如果对模型进一步量化，如精度量化到 4 位整数，则所需显存大小降为原来的 1/4 到 1/3, 意味着 3B 模型只要 2 G 显存就能进行推理。所以我们可以把一个 3B 的模型塞到手机里去运行，如果是 1B 的模型 int4 量化后内存占用不到 1G(0.5 ~ 0.67)。

本文体验 llama.cpp 对模型进行推理，在 Hugging Face 的用户设置页面 Local Apps and Hardware, 可看到一些流行的跑模型的应用程序，分别是

生成文本的: llama.cpp, LM Studio, Jan, Backyard AI, Jellybox, RecurseChat, Msty, Sanctum, LocalAI, vLLM, node-llama-cpp, Ollama, TGI
文生图的: Draw Things, DiffusionBee, Invoke, JoyFusion

阅读全文 >>

http://www.ppmy.cn/news/1551081.html

相关文章

GAMES101：现代计算机图形学入门-笔记-09

GAMES101：现代计算机图形学入门-笔记-09

久违的101图形学回归咯今天的话题应该是比较轻松的：聊一聊在渲染中比较先进的topics Advanced Light Transport 首先是介绍一系列比较先进的光线传播方法，有无偏的如BDPT（双向路径追踪），MLT（梅特罗波利斯…

阅读更多...

本地推流，服务器拉流全流程

本地推流，服务器拉流全流程

本地推流，服务器拉流全流程环境准备：准备一台服务器，其中openssl最好为1.1.1版本（可以直接使用ubuntu20.04操作系统） 服务器拉流 1、安装环境依赖 sudo apt-get update sudo apt-get install unzip sudo apt-get…

阅读更多...

C#中面试的常见问题002

C#中面试的常见问题002

1.wpf和Winfrom的区别 1. 技术基础 WPF：基于.NET Framework，使用XAML（可扩展应用程序标记语言）作为界面描述语言，支持矢量图形和高级布局。WinForms：基于.NET Framework，使用纯代码或拖放设计…

阅读更多...

Qt—QLabel 使用总结

Qt—QLabel 使用总结

参考链接：Qt—QLabel 使用总结一、简述 QLabel(标签控件) 提供了一个文本或图像的显示，没有提供用户交互功能。一个 QLabel 可以包含以下任意内容类型： -纯文本：使用 setText() 设置一个 QString 富文本：使用 setText() 设置一个富文本的 QString图像：使用 setPixma…

阅读更多...

科技“加码”编织智能防护网，中威电子助力智慧林业建设

科技“加码”编织智能防护网，中威电子助力智慧林业建设

“山泽救于火，草木植成，国之富也”。森林作为陆地生态系统的主体和重要资源，是人类生存发展的生态保障。然而，随着气候变化和人为因素的交织影响，森林火灾的威胁日益严峻，给生态环境和人类社会带来了巨大…

阅读更多...

AI潮汐日报1128期：Sora泄露引发争议、百度早期研究对AI领域Scaling Law的贡献、Meta发布系列AI开源项目

AI潮汐日报1128期：Sora泄露引发争议、百度早期研究对AI领域Scaling Law的贡献、Meta发布系列AI开源项目

AI 潮汐日报，旨在提供最新潮、最核心、最有意思的AI速递。四大专栏：今日热点、应用速递、研究进展、思维碰撞。今日热点 OpenAI文本转视频模型Sora泄露引发争议 OpenAI的文本转视频AI模型Sora在Hugging Face上遭遇泄露，泄露者为参与测试的…

阅读更多...

IT成长之路-ubuntu驱动篇

IT成长之路-ubuntu驱动篇

历时3天的蹂躏，总结驱动安装全面教程。步骤一、安装gcc、g和make包 #脚本更新 sudo apt-get update #编译gcc sudo apt-get install gcc #编译g sudo apt-get install g #编译make sudo apt-get install make 注意： gcc、g版本可能会导致显卡驱动安…

阅读更多...

开源TTS语音克隆神器GPT-SoVITS_V2版本地整合包部署与远程使用生成音频

开源TTS语音克隆神器GPT-SoVITS_V2版本地整合包部署与远程使用生成音频

文章目录前言1.GPT-SoVITS V2下载2.本地运行GPT-SoVITS V23.简单使用演示4.安装内网穿透工具4.1 创建远程连接公网地址 5. 固定远程访问公网地址前言本文主要介绍如何在Windows系统电脑使用整合包一键部署开源TTS语音克隆神器GPT-SoVITS，并结合cpolar内网穿透工…

阅读更多...

最新文章