ModaHub魔搭社区:向量数据库MIlvus服务端配置(三)

news/2024/10/17 6:23:57/

目录

gpu 区域

logs 区域

metric_config 区域


gpu 区域

在该区域选择是否在 Milvus 里启用 GPU 用于搜索和索引创建。同时使用 CPU 和 GPU 可以达到资源的最优利用,在特别大的数据集里做搜索时性能更佳。

若要切换到 CPU-only 模式,只要将 enable 设置为 false。

| 参数 | 说明 | 类型 | 默认值 | | ———————————— | —————————————————————————————— | ——————————————————————————————- | ——————————————————————————————- | | enable | 是否开启 GPU 用于搜索和索引创建。

  • true:开启 GPU。
  • false:不开启 GPU。

| Boolean | false | | cache_size | 显存中用于驻留搜索数据的缓存空间大小。该值不能超过显存总量。格式请见 空间大小的格式。 | String | 1GB | | gpu_search_threshold | 使用 GPU 查询的阈值。用 nq 表示单批次查询的向量数,则搜索计算方式如下:

 

  • nq ≥ gpu_search_threshold:搜索计算只在 GPU 上进行。
  • nq < gpu_search_threshold:搜索计算将在 CPU 和 GPU 上协同进行。

| Integer | 1000 | | search_devices | 用于搜索的 GPU 设备,格式为“gpux”。其中“x”是 GPU 的序号,例如“gpu0”。 | DeviceList | gpu0 | | build_index_devices | 用于创建索引的 GPU 设备,格式为“gpux”。其中“x”是 GPU 的序号,例如“gpu0”。 | DeviceList | gpu0 |

在 Milvus 里,创建索引和搜索是两个独立分开的过程,可以只在 CPU,或同时在 CPU 和 GPU 里进行。通过将 GPU 添加至 search_devices 或者 build_index_devices 下方,你可以指定多个 GPU 设备来进行创建索引或搜索。请参考下面的 YAML 示例代码:

 

logs 区域

| 参数 | 说明 | 类型 | 默认值 | | ———————————— | —————————————————————————————— | ——————————————————————————————- | ——————————————————————————————- | | level | 日志打印的最低级别。日志级别:debug < info < warning < error < fatal。 | String | debug | | trace.enable | 是否开启 trace 级别日志打印。

  • true:开启 trace 级别日志打印。
  • false:不开启 trace 级别日志打印。

| Boolean | true | | path | 日志存储路径。 | String | /var/lib/milvus/logs | | max_log_file_size | 单个日志文件的大小限制,范围:1024MB ~ 4096MB。格式请见 空间大小的格式。 | Integer | 1024MB | | log_rotate_num | 每个日志级别最多保存的文件数量,范围:[0, 1024]。0 代表日志文件数无限制。 | Integer | 0 |

 

metric_config 区域

| 参数 | 说明 | 类型 | 默认值 | | ———————— | ———————————————————— | ————————————————————- | ———————————————————— | | enable | 是否开启 Prometheus 监控。

  • true:开启 Prometheus 监控。
  • false:不开启 Prometheus 监控。

| Boolean | false | | address | 访问 Prometheus Pushgateway 的 IP 地址。 | IP | 127.0.0.1 | | port | 访问 Prometheus Pushgateway 的端口号。范围:[1025, 65534]。 | Integer | 9091 |

在 Milvus 配置文件中,空间大小的格式为“数字+单位”,如“4GB”。

  • 数字和单位之间没有空格。
  • 数字必须是整数。
  • 可选单位为 GB、MB、KB。

http://www.ppmy.cn/news/589377.html

相关文章

Linux ACPI 高级电源管理状态

ACPI Power States 中定义了 G、S、D、C、P 5 个大的电力状态。 G状态 Global system state G 状态表示的是用户看到的整个系统的电力状态。 G0 运行模式。向硬件提供电源&#xff0c;软件可以运行的状态。 G1 停止模式。所谓的待机或休眠状态。 G2 软件为关闭状态&#xf…

金融场景下Java微服务图片压缩/加密等处理实战

目录导读 金融场景下Java微服务图片压缩/加密等处理实战1. 业务场景1.1 业务诉求1.2 业务分析 2. 技术分析2.1 技术预研2.2 处理问题汇总 3. 达成效果4. 编码解构 金融场景下Java微服务图片压缩/加密等处理实战 研究某项技术或者代码框架时&#xff0c;如果没有清晰的业务目标…

【Python爬虫与数据分析】进阶语法

目录 一、异常捕获 二、迭代器 三、拆包、聚合、映射 四、filter() 函数 五、匿名函数 六、闭包 七、装饰器 一、异常捕获 异常捕获可增强程序的健壮性&#xff0c;即程序在遇到遇到异常的时候并不会做中断处理&#xff0c;而是会将异常抛出&#xff0c;由程序员来分析…

红警3修改器无法连接服务器,红警3序列号修改器-不能加入游戏怎么办?红警3连局域网说cd-– 手机爱问...

2018-03-05 为什么我的红警不能联局域网 红警局域网联机的具体方法: 适用于原版红警、尤里复仇&#xff0c;及任何同样的扩展版。 第一步&#xff1a;安装IPX协议。 方法&#xff1a; 控制面板——网络连接(或网上邻居属性)——本地连接属性 ——在“此连接使用下列项目”中&am…

Eclipse 3.3 汉化包下载

Eclipse 是一款很好的IDE环境&#xff0c;功能完整而成熟。它使用 Java 语言开发&#xff0c;而且属于开源项目&#xff0c;网上充足的插件&#xff0c;保证了其强大的可扩展性。 Eclipse 的语言包也是以插件的形式来提供的。很可惜的是&#xff0c;从3.3版本开始&#xff0c;…

红警资源系列一 红警资源导出

XCC Mixer 1.46 解包mix文件&#xff0c;红警中比较重要的是ra2.mix&#xff0c;基本红警所有的资源都在这个包中。 对ra2.mix解包 双击可查看mix的包内容。 里面文件基本有以下两类 .shp 存储帧动画&#xff0c;比方说动员兵的每一个动作都在这个文件中&#xff0c;还有场景…

いもけんぴ 三作 汉化补丁

这几个程序 我已经完全逆向出全部源代码 所有汉化补丁 都在VS2010 下编译通过 能完全逆向出源代码 并修改成为自己的才叫真正的破解..... 支持 OS:Windows XP/VISTA/7 其中 Windows XP 需要安装 .net Framework 2.0 或者3.0系列 显卡需支持OpenGL 非简体中文系统注意&#xff…

红警2联机终极补丁

红警2联机终极补丁 转载于:https://blog.51cto.com/amcto111/498711