DeepSeek开源周,第五弹再次来袭,3FS

server/2025/3/3 18:50:17/
aidu_pl">


Fire-Flyer 文件系统(3FS)总结:

一、核心特点
3FS 是一个专为 AI 训练和推理工作负载设计的高性能分布式文件系统,利用现代 SSD 和 RDMA 网络,提供共享存储层,简化分布式应用开发。其主要特点包括:

  1. 高性能与易用性

    • 解耦架构

      整合数千个 SSD 的吞吐量和数百个存储节点的网络带宽,实现无本地性限制的存储访问。

    • 强一致性

      采用 CRAQ(链复制与分配查询)协议,确保数据强一致性,简化应用开发。

    • 标准文件接口

      基于事务性键值存储(如 FoundationDB)提供无状态元数据服务,无需学习新 API。

  2. 多样化工作负载支持

    • 数据准备

      高效管理数据分析管道的中间输出,支持大规模数据组织。

    • 数据加载器

      支持跨计算节点随机访问训练样本,无需预取或洗牌数据。

    • 检查点

      支持高吞吐量并行检查点,适用于大规模训练。

    • KVCache 推理优化

      提供高吞吐量、大容量的缓存方案,替代昂贵的 DRAM 缓存。


二、性能表现

  1. 峰值吞吐量

    • 在 180 个存储节点(每个节点配备 2×200Gbps InfiniBand NIC 和 16 个 14TiB NVMe SSD)的集群中,通过 500+ 客户端节点进行读压力测试,实现了约 6.6 TiB/s 的聚合读吞吐量。

  2. GraySort 基准测试

    • 在 25 个存储节点和 50 个计算节点的集群中,对 110.5 TiB 数据进行排序,耗时 30 分 14 秒,平均吞吐量为 3.66 TiB/min。

  3. KVCache 性能

    • 在 LLM 推理优化中,KVCache 的读吞吐量峰值达到 40 GiB/s,同时展示了垃圾回收(GC)期间的移除操作 IOPS。


三、安装与使用

  1. 获取代码

    • 克隆 GitHub 仓库

      git clone https://github.com/deepseek-ai/3fs

    • 初始化子模块:

         cd 3fs

         git submodule update --init --recursive

                     ./patches/apply.sh

  1. 安装依赖

    • 支持 Ubuntu 20.04 和 22.04,提供详细的依赖安装命令,包括 CMake、开发库、编译工具链等。

    • 额外依赖:libfuse 3.16.1+、FoundationDB 7.1+、Rust 工具链。

  2. 构建 3FS

    • 使用 CMake 构建:cmake -S . -B buildcmake --build build -j 32

  3. 运行测试集群

    • 按照设置指南部署和运行测试集群。


四、总结

 3FS 通过解耦架构、强一致性和标准文件接口,为 AI 训练和推理提供了高性能、易用的分布式存储解决方案。其出色的性能表现(如 6.6 TiB/s 的读吞吐量)和多样化工作负载支持,使其成为大规模 AI 应用的理想选择。


http://www.ppmy.cn/server/172142.html

相关文章

从0学习Spark

1.概述 定义: Apache Spark是一个开源的分布式计算系统,主要用于大规模数据处理和分析,是基于内存计算的大数据处理框架,它提供了一个高度通用的执行引擎,可以支持多种不同类型的大数据处理任务,如批处理…

嵌入式开发:傅里叶变换(4):在 STM32上面实现FFT(基于STM32L071KZT6 HAL库+DSP库)

目录 步骤 1:准备工作 步骤 2:创建 Keil 项目,并配置工程 步骤 3:在MDK工程上添加 CMSIS-DSP 库 步骤 5:编写代码 步骤 6:配置时钟和优化 步骤 7:调试与验证 步骤 8:优化和调…

Java类加载机制 双亲委派机制 八股速记版

JVM类加载机制是Java实现跨平台特性的核心机制之一,整个过程可分为以下五个阶段: 一、类加载流程 加载(Loading) 通过全限定名获取二进制字节流将字节流转换为运行时数据结构生成对应的java.lang.Class对象 验证(V…

全面解析:如何查找电脑的局域网与公网IP地址‌

在数字化时代,IP地址作为网络设备的唯一标识,对于网络连接、远程访问、网络诊断等方面都至关重要。无论是出于工作需要,还是解决网络问题,了解怎么查找电脑的IP地址都是一项必备技能。本文将详细介绍几种常见的方法,帮…

【网络安全 | 扫描子域+发现真实IP】CloakQuest3r安装使用详细教程

原创文章,禁止转载。 本文仅作学习交流使用,不得用于非法渗透,笔者不承担任何责任。 文章目录 简介功能介绍执行流程限制安装步骤可选功能:SecurityTrails API使用示例简介 CloakQuest3r 是一款强大的 Python 工具,专为揭示受 Cloudflare 及类似服务保护的网站真实 IP 地…

前端面试题---小程序跟vue的声明周期的区别

1. 小程序生命周期 小程序的生命周期主要分为 页面生命周期 和 应用生命周期。每个页面和应用都有自己独立的生命周期函数。 应用生命周期 小程序的应用生命周期函数与全局应用相关,通常包括以下几个钩子: onLaunch(options):应用初始化时触…

DeepSeek MLA(Multi-Head Latent Attention)算法浅析

目录 前言1. 从MHA、MQA、GQA到MLA1.1 MHA1.2 瓶颈1.3 MQA1.4 GQA1.5 MLA1.5.1 Part 11.5.2 Part 21.5.3 Part 3 结语参考 前言 学习 DeepSeek 中的 MLA 模块,究极缝合怪,东抄抄西抄抄,主要 copy 自苏神的文章,仅供自己参考&#…

绕过信息过滤与注入限制

绕过 information_schema 过滤 information_schema 是 MySQL 中存储元数据的系统数据库,常用于 SQL 注入中获取表名、列名等信息。当 information_schema 被过滤时,可以通过以下方法绕过。 1 替代视图 使用 sys 库(MySQL 5.7) …