MTEB - Embedding 模型排行榜

ops/2024/9/23 12:16:38/

文章目录

    • 关于 MTEB
    • MTEB 任务和数据集概览
    • 使用 MTEB Pythont 库
      • Installation
      • 使用


MTEB_2">关于 MTEB

MTEB : Massive Text Embedding Benchmark

  • github : https://github.com/embeddings-benchmark/mteb
  • huggingface : https://huggingface.co/spaces/mteb/leaderboard
  • paper : https://paperswithcode.com/paper/mteb-massive-text-embedding-benchmark

中文榜单(2024-05-03)

在这里插入图片描述


英文

在这里插入图片描述


MTEB__23">MTEB 任务和数据集概览

多模态标记为紫色。
在这里插入图片描述


MTEB_Pythont__28">使用 MTEB Pythont 库

Installation

pip install mteb

使用

  • Using a python script (see scripts/run_mteb_english.py and mteb/mtebscripts for more):
from mteb import MTEB
from sentence_transformers import SentenceTransformer# Define the sentence-transformers model name
model_name = "average_word_embeddings_komninos"
# or directly from huggingface:
# model_name = "sentence-transformers/all-MiniLM-L6-v2"model = SentenceTransformer(model_name)
evaluation = MTEB(tasks=["Banking77Classification"])
results = evaluation.run(model, output_folder=f"results/{model_name}")

  • 使用命令行
mteb --available_tasksmteb -m sentence-transformers/all-MiniLM-L6-v2 \-t Banking77Classification  \--verbosity 3# if nothing is specified default to saving the results in the results/{model_name} folder
  • Using multiple GPUs in parallel can be done by just having a custom encode function that distributes the inputs to multiple GPUs like e.g. here or here.

伊织 2024-05-03(五)


http://www.ppmy.cn/ops/36695.html

相关文章

Python ansible 如何使用

Ansible是一个开源的配置管理、应用部署和任务执行系统,它使用SSH进行通信,无需在目标服务器上安装代理。Ansible通过YAML格式的剧本(playbooks)来描述配置和任务,这些剧本易于理解和编写。 以下是如何在Python项目中…

【前端】HTML基础(3)

文章目录 前言一、HTML基础1、表格标签1.1 基本使用1.2 合并单元格 2、列表标签2.1 无序列表2.2 有序列表2.3 自定义列表 3、 表单标签2.1 form标签2.2 input标签2.3 label标签2.4 select标签2.5 textarea标签 4、无语义标签5、HTML特殊字符 前言 这篇博客仅仅是对HTML的基本结…

赶紧收藏!2024 年最常见 100道 Java 基础面试题(三十三)

上一篇地址:赶紧收藏!2024 年最常见 100道 Java 基础面试题(三十二)-CSDN博客 六十五、说一下JSP的4种作用域? 在JSP(JavaServer Pages)中,作用域(Scope)是…

纯血鸿蒙APP实战开发——手写绘制及保存图片

介绍 本示例使用drawing库的Pen和Path结合NodeContainer组件实现手写绘制功能。手写板上完成绘制后,通过调用image库的packToFile和packing接口将手写板的绘制内容保存为图片,并将图片文件保存在应用沙箱路径中。 效果图预览 使用说明 在虚线区域手写…

node.js中的断言

assert.ok(value, [message]):如果value不为真,则抛出一个AssertionError,可选地包含message。 const assert require(assert); assert.ok(true); // 没有错误 assert.ok(false, 这里应该是true); // 抛出 AssertionError: 这里应该是tru…

UE5 UMG

锚点 参考链接:虚幻5UI系统(UMG)基础(已完结)_哔哩哔哩_bilibili

Java毕业设计 基于SSM 健身中心管理系统

Java毕业设计 基于SSM 健身中心管理系统 SSM 健身中心管理系统 功能介绍 首页 图片轮播 登录注册 场地展示 场地详情 立即租赁 课程展示 课程详情 课程预约 器材展示 器材详情 立即租赁 优惠信息展示 优惠详情 健身资讯 资讯详情 个人中心 收藏 我的预约 我的租赁 后台管理 …

pxe远程安装

PXE 规模化:可以同时装配多台服务器 自动化:自动安装操作系统和各种配置 不需要光盘U盘 前置需要一台PXE服务器 pxe是预启动执行环境,再操作系统之前运行 实验: 首先先关闭防火墙等操作 [rootlocalhost ~]# systemc…