DeepSeek本地接口调用(Ollama)

server/2025/3/15 3:02:34/

前言

        上篇博文,我们通过Ollama搭建了本地的DeepSeek模型,本文主要是方便开发人员,如何通过代码或工具,通过API接口调用本地deepSeek模型

前文:DeepSeek-R1本地搭建_deepseek 本地部署-CSDN博客

注:本文不仅仅适用DeepSeek, 通过Ollama安装的模型,都适用

一:Ollama接口

        上文中,我们采用ollama来搭建deepSeek r1模型,所有调用本地deepSeek模型,可以使用ollama开放的API来操作。

        

        ollama默认开放端口:11434        

        ollama接口文档地址:https://github.com/ollama/ollama/blob/main/docs/api.md

里面包含各种接口,包括如下:(访问文档,点击自行选择)

注意:文档是英文,看不懂用浏览器翻一下

​ 

二:调用案例(创建聊天)

API文档地址:(参考)https://github.com/ollama/ollama/blob/main/docs/api.md#generate-a-chat-completionhttps://github.com/ollama/ollama/blob/main/docs/api.md#generate-a-chat-completion

接口地址:http://localhost:11434/api/chat

请求方式:POST

请求类型:JSON

请求内容:

{"model": "deepseek-r1:1.5b","messages": [{"role": "user","content": "你好?"}]
}

注:这里model代码你的模型,content是你要聊天的内容,role指代角色,还要其他参数,请参考官方文档。

POSTMAN访问如下:

三:调用案例(生成请求)

API文档地址:(参考)https://github.com/ollama/ollama/blob/main/docs/api.md#generate-a-completionhttps://github.com/ollama/ollama/blob/main/docs/api.md#generate-a-completion

接口地址:http://localhost:11434/api/generate

请求方式:POST

请求类型:JSON

请求内容:

{"model": "deepseek-r1:1.5b","prompt": "你好","stream": false
}

注:如果stream设置为false,响应将是单个 JSON 对象

返回结果:

{"model": "deepseek-r1:1.5b","created_at": "2025-03-04T08:40:06.4879238Z","response": "<think>\n\n</think>\n\n你好!很高兴见到你,有什么我可以帮忙的吗?","done": true,"done_reason": "stop","total_duration": 951604700,"load_duration": 23765300,"prompt_eval_count": 4,"prompt_eval_duration": 57000000,"eval_count": 17,"eval_duration": 870000000
}

POSTMAN:

四:其他API

请参考官方文档:

https://github.com/ollama/ollama/blob/main/docs/api.md


http://www.ppmy.cn/server/175041.html

相关文章

go GRPC学习笔记

本博文源于笔者正在学习的gprc&#xff0c;相关配套书籍素材来源是《Go编程进阶实战》&#xff0c;博文内容主要包含了RPC模式讲解&#xff0c;RPC通过htttp访问、拦截器、提高服务端与客户端容错的内容配置 在此之前需要下载protoc&#xff0c;这里不做下载过程 1、RPC模式 …

架构思维:高性能架构_01基础概念

文章目录 概述基础概念性能指标利特尔法则&#xff08;O T L&#xff09;系统优化策略1. 降低耗时&#xff08;L↓&#xff09;2. 增加容量&#xff08;O↑&#xff09;3. 增加时延&#xff08;L↑&#xff09; 场景化指标选择响应时间优先吞吐量/容量优先平衡策略 概述 一个…

python web开发django库安装与使用

下面我将指导您如何安装 Django 库以及基本的使用方法。Django 是一个高级的 Python Web 框架&#xff0c;它鼓励快速开发和干净、实用的设计。以下是详细的步骤&#xff1a; 1. 安装 Django 首先&#xff0c;确保您的系统上已经安装了 Python 和 pip&#xff08;Python 的包…

[Linux] Not enough free space to extract *.zip or file

原因分析&#xff1a; 导致该错误的主要原因是&#xff0c;虽然你的主分区确实有足够的可用空间&#xff0c;但很多图形解压工具在解压时会默认先把文件写到一个较小的临时文件系统&#xff08;tmpfs&#xff09;&#xff0c;比如这里只显示 1.6 GB。ZIP 文件在解压过程中会产…

解决git fetch 成功后还是不能checkout到fetch分支

错误记录 当代码仓里分支信息非常多时&#xff0c;如果每次都用git pull更新信息&#xff0c;会耗费很长时间&#xff0c;因此可以用git fetch把我们要checkout的分支线fetch下来&#xff0c;再去checkout。但是&#xff0c;我遇到一个问题&#xff0c;这个看起来已经fetch到指…

框架源码私享笔记(02)Mybatis核心框架原理 | 一条SQL透析核心组件功能特性

最近在思考一个问题&#xff1a;如何能够更好的分享主流框架源码学习笔记&#xff08;主要是源码部分&#xff09;?让有缘刷到的同学既可以有所收获&#xff0c;还能保持对相关技术架构探讨学习热情和兴趣。以及自己也保持较高的分享热情和动力。 今天尝试用一个SQL查询作为引…

fpga系列 HDL:ModelSim 波形绘制tips

Stop Drawing 按钮 暂停波形更新&#xff1a; 点击“Stop Drawing”按钮时&#xff0c;ModelSim 会暂停将仿真结果实时绘制到波形窗口中。仿真继续运行&#xff0c;波形窗口不会实时更新显示新的仿真数据。 提高仿真速度&#xff1a; 在大规模设计或长时间仿真的情况下&#x…

Tomcat 安装

一、Tomcat 下载 官网&#xff1a;Apache Tomcat - Welcome! 1.1.下载安装包 下载安装包&#xff1a; wget https://dlcdn.apache.org/tomcat/tomcat-9/v9.0.102/bin/apache-tomcat-9.0.102.tar.gz 安装 javajdk。 yum install java-1.8.0-openjdk.x86_64 -y /etc/altern…