Datawhale Ollama教程笔记5

devtools/2025/2/22 19:47:31/

Dify 接入 Ollama 部署的本地模型

Dify 支持接入 Ollama 部署的大型语言模型推理和 embedding 能力。

快速接入

  1. 下载 Ollama

    访问 Ollama 安装与配置,查看 Ollama 本地部署教程。

  2. 运行 Ollama 并与 Llama 聊天

    ollama run llama3.1Copy to clipboardErrorCopied

    启动成功后,ollama 在本地 11434 端口启动了一个 API 服务,可通过 http://localhost:11434 访问。

    其他模型可访问 Ollama Models 了解详情。

  3. 在 Dify 中接入 Ollama

    在 设置 > 模型供应商 > Ollama 中填入:

     

     

    • 模型名称:llama3.1

    • 基础 URL :http://<your-ollama-endpoint-domain>:11434

      此处需填写可访问到的 Ollama 服务地址。

      若 Dify 为 docker 部署,建议填写局域网 IP 地址,如:http://192.168.1.100:11434 或 docker 宿主机 IP 地址,如:http://172.17.0.1:11434

      注:查找局域网 IP 地址命令:

      • 在 Linux/macOS 上,使用命令 ip addr show 或 ifconfig
      • 在 Windows 上,使用 ipconfig 命令查找类似的地址。
      • 通常,这个地址会在 eth0 或 wlan0 接口下显示,取决于你是使用有线网络还是无线网络。

      若为本地源码部署,可填写 http://localhost:11434

    • 模型类型:对话

    • 模型上下文长度:4096

      模型的最大上下文长度,若不清楚可填写默认值 4096。

    • 最大 token 上限:4096

      模型返回内容的最大 token 数量,若模型无特别说明,则可与模型上下文长度保持一致。

    • 是否支持 Vision:

      当模型支持图片理解(多模态)勾选此项,如 llava

    点击 "保存" 校验无误后即可在应用中使用该模型。

    Embedding 模型接入方式与 LLM 类似,只需将模型类型改为 Text Embedding 即可。

  4. 使用 Ollama 模型

    进入需要配置的 App 提示词编排页面,选择 Ollama 供应商下的 llama3.1 模型,配置模型参数后即可使用。


http://www.ppmy.cn/devtools/161010.html

相关文章

安装海康威视相机SDK后,catkin_make其他项目时,出现“libusb_set_option”错误的解决方法

硬件&#xff1a;雷神MIX G139H047LD 工控机 系统&#xff1a;ubuntu20.04 之前运行某项目时&#xff0c;处于正常状态。后来由于要使用海康威视工业相机&#xff08;型号&#xff1a;MV-CA013-21UC&#xff09;&#xff0c;便下载了并安装了该相机的SDK&#xff0c;之后运行…

go WEB框架

推荐选型 https://chat.deepseek.com/a/chat/s/e6061607-8f33-4768-a5f0-8970cb1ffefd echo github&#xff1a;https://github.com/labstack/echo wiki&#xff1a;https://echo.labstack.com/docs/quick-start block&#xff1a;https://blog.csdn.net/qq_38105536/artic…

HTML Canvas clip 深入全面讲解

在HTML5的<canvas>元素中&#xff0c;裁剪路径&#xff08;clipping path&#xff09;是一个非常强大的功能&#xff0c;它允许你定义一个区域&#xff0c;在该区域内进行绘制&#xff0c;而区域外的内容将不会被显示。通过合理使用裁剪路径&#xff0c;可以实现复杂的图…

EasyRTC低延迟通信与智能处理:论嵌入式WebRTC与AI大模型的技术融合

在当今数字化时代&#xff0c;实时通信的需求日益增长&#xff0c;视频通话作为一种高效、直观的沟通方式&#xff0c;广泛应用于各个领域。WebRTC技术的出现&#xff0c;为实现浏览器之间的实时音视频通信提供了便捷的解决方案。而基于WebRTC技术的EasyRTC视频通话SDK&#xf…

数据结构——哈希表

一、哈希表 1.1 哈希表的概念 散列表&#xff08;Hash table&#xff0c;也叫哈希表&#xff09;&#xff0c;是根据关键码值(Key value)而直接进行访问的数据结构。也就是说&#xff0c;它通过把关键码值映射到表中一个位置来访问记录&#xff0c;以加快查找的速度。这个映射函…

认识HTML的标签结构

一、HTML的基本概念 1.什么是HTML&#xff1f; ①HTML是描述网页的一种标记语言&#xff0c;也被称为超文本标记语言【并不是一种编程语言】 ②HTML包含了HTML标签和文本内容 ③HTML文档也称为web页面 2.HTML的标签 HTML的标签通常成对出现&#xff0c;HTML文档由标签和受…

nats集群搭建

本次使用三台机器搭建nats集群&#xff0c;ip分别为192.168.20.7、192.168.20.8、192.168.20.10&#xff0c;预先在三台机器上装好nats&#xff0c;版本为0.0.35。 1. 在192.168.20.7机器上操作&#xff0c;配置server.conf # 为节点设置唯一的名称 server_name: node1 port: …

多场景建模在得物交易搜索下的创新与实践

一、整体概述 2024年得物算法团队基于交易搜索的场景特点与数据现状&#xff0c;围绕“多场景建模”开展了一系列工作&#xff0c;取得了较大幅度的在线业务指标提升&#xff1b;同时我们利用碎片时间将积累的技术经验形成相应的论文&#xff0c;成功被搜索推荐/数据挖掘领域顶…