AI-Ollama本地大语言模型运行框架与Ollama javascript接入

news/2025/3/6 12:18:49/

1.Ollama

        Ollama 是一个开源的大型语言模型(LLM)平台,旨在让用户能够轻松地在本地运行、管理和与大型语言模型进行交互。

        Ollama 提供了一个简单的方式来加载和使用各种预训练的语言模型,支持文本生成、翻译、代码编写、问答等多种自然语言处理任务。

        Ollama 的特点在于它不仅仅提供了现成的模型和工具集,还提供了方便的界面和 API,使得从文本生成、对话系统到语义分析等任务都能快速实现。

        与其他 NLP 框架不同,Ollama 旨在简化用户的工作流程,使得机器学习不再是只有深度技术背景的开发者才能触及的领域。

        Ollama 支持多种硬件加速选项,包括纯 CPU 推理和各类底层计算架构(如 Apple Silicon),能够更好地利用不同类型的硬件资源。

Ollama 简介 | 菜鸟教程https://www.runoob.com/ollama/ollama-intro.html

2.Ollama下载

Ollama下载 - 官方正版 - 极客应用Ollama可以部署开箱即用的Ai大模型,省去安装环境和下载模型的步骤,让零基础的人也能在本地启动并运行 DeepSeek-R1,Llama 3.3,Gemma 2等AI大模型https://www.gy328.com/app/ollama/根据系统选择下载对应的Ollama版本

3.cmd模型基本操作

 检测是否安装

ollama --version

启动下载对应模型

ollama run llama3.2

选择模型应注意:7B模型至少8GB内存,13B模型需要16GB

 退出模型

/bye

 

具体对应操作查看菜鸟教程

Ollama 基本概念 | 菜鸟教程https://www.runoob.com/ollama/ollama-basic.html参考博客

Ollama保姆级教程_ollama ps-CSDN博客文章浏览阅读5.7k次,点赞28次,收藏39次。Ollama能够更容易的让大模型在本地运行起来,没错,是运行起来,至于交互就差点意思了。总不能总是铜鼓命令行来交互吧,这样也太不优雅了!实际上Ollama主要是用来提供服务的,也就是作为服务端,但是可以通过配合其他的UI界面来更方便的使用大模型,例如Open WebUI等。Ollama官网:https://ollama.com/downloadOllama文档:https://github.com/ollama/ollama/tree/main/docs。_ollama ps https://blog.csdn.net/andyyah/article/details/140891679?fromshare=blogdetail&sharetype=blogdetail&sharerId=140891679&sharerefer=PC&sharesource=2301_76671906&sharefrom=from_link

4.Ollama javascript接入

4.1 前端项目中引入Ollama依赖包(sdk)
npm i ollama
4.2 vue2中安装axios库

        使用axios库来发送HTTP请求到Ollama的API。

npm install axios
4.3 api.js调用模型Api
import axios from 'axios';const API_URL = 'http://localhost:11434'; // Ollama默认的API端口是11434export const generateText = async (prompt) => {try {const response = await axios.post(`${API_URL}/api/generate`, {model: 'mistral', // 指定模型prompt: prompt,   // 输入的提示文本stream: true,     // 流式传输结果(可选)});if (response.data) {return response.data;} else {throw new Error('No data received');}} catch (error) {console.error('Error generating text:', error);throw error;}
};
4.4 组件中使用服务

调用服务生成文本结果

<template><div><textarea v-model="prompt" placeholder="Enter your prompt"></textarea><button @click="generateText">Generate</button><div v-if="generatedText">{{ generatedText }}</div></div>
</template><script>
import { generateText } from './api'; // 引入你的API服务文件export default {data() {return {prompt: '',generatedText: ''};},methods: {async generateText() {try {const response = await generateText(this.prompt);this.generatedText = response; // 直接处理响应或根据需要解析响应数据流等逻辑(取决于API的实现)} catch (error) {console.error('Error generating text:', error);}}}
};
</script>

 运行项目与模型,注意node版本对应。

API 参考文档 -- Ollama 中文文档|Ollama官方文档https://ollama.cadn.net.cn/api.html

5.node版本不匹配请使用nvm管理版本 

node-nvm node版本管理器使用-CSDN博客node-nvm node版本管理器使用 https://blog.csdn.net/2301_76671906/article/details/146038866?fromshare=blogdetail&sharetype=blogdetail&sharerId=146038866&sharerefer=PC&sharesource=2301_76671906&sharefrom=from_link


http://www.ppmy.cn/news/1577063.html

相关文章

SpringMvc与Struts2

一、Spring MVC 1.1 概述 Spring MVC 是 Spring 框架的一部分&#xff0c;是一个基于 MVC 设计模式的轻量级 Web 框架。它提供了灵活的配置和强大的扩展能力&#xff0c;适合构建复杂的 Web 应用程序。 1.2 特点 轻量级&#xff1a;与 Spring 框架无缝集成&#xff0c;依赖…

valgrind 检测多线程 bug,检测 并发 bug concurrent bug parallel bug

valgrind --toolhelgrind ./your_program 如果检测的对象是大型程序&#xff0c;可以设定仅在某些函数中开启 valgrind 的检测&#xff1a; Valgrind 提供了一些客户请求&#xff08;client requests&#xff09;&#xff0c;可以在代码中插入特定的宏来控制 Valgrind 的行为。…

Windows 图形显示驱动开发-WDDM 3.2-本机 GPU 围栏对象(一)

本文介绍 GPU 围栏同步对象&#xff0c;该对象可用于 GPU 硬件计划阶段 2 中真正的 GPU 到 GPU 同步。 从 Windows 11 版本 24H2 (WDDM 3.2) 开始支持此功能。 图形驱动程序开发人员应熟悉 WDDM 2.0 和 GPU 硬件计划阶段 1。 WDDM 2.x 的受监视围栏同步对象 WDDM 2.x 的受监视…

2025最新Transformer模型及深度学习前沿技术应用

第一章、注意力&#xff08;Attention&#xff09;机制 1、注意力机制的背景和动机&#xff08;为什么需要注意力机制&#xff1f;注意力机制的起源和发展里程碑&#xff09;。 2、注意力机制的基本原理&#xff08;什么是注意力机制&#xff1f;注意力机制的数学表达与基本公…

鬼泣:项目前置设置杂项

能帮到你的话&#xff0c;就给个赞吧 &#x1f618; 文章目录 插件niagara ui render&#xff1a;在 UI 中渲染 Niagara 特效skeletal editor&#xff1a;编辑骨骼&#xff0c;调整骨骼动画motion warping&#xff1a;根据目标自动调整角色动画。animation warping&#xff1a;…

2024华为OD机试真题-整数编码算法实现(C++)-E卷-100分

2024华为OD机试题库-(E卷+D卷)-(JAVA、Python、C++) 目录 题目描述 输入描述 输出描述 用例1 用例2 用例3 考点 题目解析 代码 c++ 题目描述 实现一种整数编码方法,使得待编码的数字越小,编码后所占用的字节数越小。 编码规则如下: 编码时7位一组,每个字节的低…

LLM 模型 Prompt 工程

目录 1、Prompt 基础概念 2、Prompt 主要构成 3、Prompt 相关技术 3.1、思维链 3.2、自洽性 3.3、思维树 1、Prompt 基础概念 Prompt 工程是通过设计和优化自然语言提示&#xff08;Prompt&#xff09;&#xff0c;引导LLM生成符合特定任务需求的输出的技术。其核心目标是…

基于Android平台的SOME/IP测试模块 EPT-ETS

在汽车产业智能化、网联化的时代浪潮中&#xff0c;汽车电子系统正经历着前所未有的变革。SOME/IP&#xff08;Scalable service-Oriented MiddlewarE over IP&#xff09;协议作为汽车电子通信领域的关键技术&#xff0c;其稳定性、可靠性与高效性对于整车性能的提升起着至关重…