MongoDB中的横向扩容数据分片

devtools/2025/1/24 14:05:39/

MongoDB中的分片启用及应用

分片(Sharding)是MongoDB为解决大规模数据集存储和高并发访问设计的一种分布式存储机制。通过分片,数据可以水平拆分并分布在多个服务器(物理或虚拟)上,以提升性能和容量。


1. 分片的核心概念

(1) 分片(Shard)
  • 每个分片是一个独立的MongoDB实例或副本集,存储数据集的一部分。
  • 分片可以独立承担读写任务,提升负载能力。
(2) 分片键(Shard Key)
  • 是集合中的一个字段或字段组合,用于决定数据分布在哪个分片上。
  • MongoDB根据分片键拆分集合中的数据。
(3) Config Server
  • 用于存储分片的元数据(例如分片键范围、数据分布等)。
  • 是分片集群的核心协调器,所有的分片信息都存储在Config Server中。
(4) MongoS
  • MongoS是分片集群的路由服务。
  • 客户端通过MongoS与分片集群交互,而无需直接访问具体分片。

2. 启用分片的步骤

(1) 环境准备
  • 主机规划

    • 至少需要3台服务器:
      1. Config Server(可以是3个节点,建议使用副本集模式)。
      2. Shard Servers(实际存储数据的分片服务器,建议每个分片为副本集)。
      3. MongoS(分片集群的路由服务,建议至少部署1个)。
  • 安装MongoDB

    • 确保所有节点安装相同版本的MongoDB。
(2) 配置分片集群

以下为分片集群的部署流程:

  1. 启动Config Server

     

    bash

    复制编辑

    mongod --configsvr --replSet configReplSet --port 27019 --dbpath /data/configdb --bind_ip 0.0.0.0

    • --configsvr:指定为Config Server。
    • --replSet:为Config Server启用副本集。
  2. 初始化Config Server副本集: 在任意一个Config Server上,运行mongo,然后初始化副本集:

     

    javascript

    复制编辑

    rs.initiate({ _id: "configReplSet", configsvr: true, members: [ { _id: 0, host: "config1:27019" }, { _id: 1, host: "config2:27019" }, { _id: 2, host: "config3:27019" } ] });

  3. 启动分片服务器(Shard Server): 每个分片是一个独立的副本集。例如,启动一个分片:

     

    bash

    复制编辑

    mongod --shardsvr --replSet shard1ReplSet --port 27018 --dbpath /data/shard1 --bind_ip 0.0.0.0

  4. 初始化分片副本集: 在任意一个分片服务器上,初始化副本集:

     

    javascript

    复制编辑

    rs.initiate({ _id: "shard1ReplSet", members: [ { _id: 0, host: "shard1node1:27018" }, { _id: 1, host: "shard1node2:27018" }, { _id: 2, host: "shard1node3:27018" } ] });

  5. 启动MongoS路由服务

     

    bash

    复制编辑

    mongos --configdb configReplSet/config1:27019,config2:27019,config3:27019 --port 27017 --bind_ip 0.0.0.0

  6. 添加分片到集群: 在MongoS实例上连接mongo客户端,添加分片:

     

    javascript

    复制编辑

    sh.addShard("shard1ReplSet/shard1node1:27018,shard1node2:27018,shard1node3:27018"); sh.addShard("shard2ReplSet/shard2node1:27018,shard2node2:27018,shard2node3:27018");

(3) 启用集合的分片
  • 启用数据库的分片功能:

     

    javascript

    复制编辑

    sh.enableSharding("myDatabase");

  • 为集合设置分片键并启用分片:

     

    javascript

    复制编辑

    sh.shardCollection("myDatabase.myCollection", { "shardKeyField": 1 });


3. 分片的应用场景

(1) 处理大规模数据
  • 当数据量无法单台服务器存储时,可以通过分片扩展存储容量。
(2) 高并发读写
  • 分片将请求分散到多个服务器,提高读写性能。
(3) 地理分布场景
  • 数据可以根据地理位置分片,减少跨地区的访问延迟。
(4) 热点数据管理
  • 可以基于分片键,将热点数据均匀分布到多个分片,避免单节点瓶颈。

4. 注意事项

  1. 分片键设计很重要

    • 应选择具有高卡片性(unique values)的字段。
    • 避免选择会导致热点问题的字段(如时间戳)。
  2. 分片数据平衡

    • MongoDB会自动平衡分片数据,但大规模重分片可能会影响性能。
  3. 分片配置的复杂性

    • 配置和维护分片集群需要经验丰富的DBA。
  4. 事务支持

    • 从MongoDB 4.2开始,支持跨分片事务,但会增加性能开销。

总结

MongoDB分片是实现水平扩展的重要机制,适用于大规模数据和高并发场景。启用分片需要配置分片集群,并合理设计分片键以优化数据分布和性能。虽然分片可以解决很多问题,但它的配置和维护复杂度较高,适合有明确扩展需求的应用场景。


http://www.ppmy.cn/devtools/153148.html

相关文章

基于LangGraph、Groq和Tavily打造可以调用外部搜索引擎工具的对话机器人(核心代码 万字详解)

一、python环境 & 相关库版本信息 代码运行在 conda 创建的python环境下,python和相关库的版本信息如下: $ python --version Python 3.12.3$ pip list | grep langchain langchain 0.3.15 langchain-community 0.3.15 lang…

高效建站指南:通过Portainer快速搭建自己的在线网站

文章目录 前言1. 安装Portainer1.1 访问Portainer Web界面 2. 使用Portainer创建Nginx容器3. 将Web静态站点实现公网访问4. 配置Web站点公网访问地址4.1公网访问Web站点 5. 固定Web静态站点公网地址6. 固定公网地址访问Web静态站点 前言 Portainer是一个开源的Docker轻量级可视…

【玩转全栈】----Django模板的继承

先赞后看,养成习惯!!! 目录 模板继承的好处 模板继承的语法规则 更新代码 上文中的部门管理页面: 【玩转全栈】----Django制作部门管理页面-CSDN博客 大家会发现,由于定义了多个html文件,多个ht…

Selenium配合Cookies实现网页免登录

文章目录 前言1 方案一:使用Chrome用户数据目录2 方案二:手动获取并保存Cookies,后续使用保存的Cookies3 注意事项 前言 在进行使用Selenium进行爬虫、网页自动化操作时,登录往往是一个必须解决的问题,但是Selenium每次…

【NLP高频面题】LSTM的前向计算如何进行加速?

【NLP高频面题】LSTM的前向计算如何进行加速? 重要性:★★★ 核心思想:将小矩阵合并成大矩阵再进行梯度分块(Reduce → Map)。 合并计算遗忘门、输入门、输出门和新增信息的仿射变换,使用“大矩阵”加速…

【BQ3568HM开发板】如何在OpenHarmony上通过校园网的上网认证

引言 前面已经对BQ3568HM开发板进行了初步测试,后面我要实现MQTT的工作,但是遇到一个问题,就是开发板无法通过校园网的认证操作。未认证的话会,学校使用的深澜软件系统会屏蔽所有除了认证用的流量。好在我们学校使用的认证系统和…

STM32补充——FLASH

目录 1.内部FLASH构成(F1) 2.FLASH读写过程(F1) 2.1内存的读取 2.2闪存的写入 2.3FLASH接口寄存器(写入 & 擦除相关) 3.FLASH相关HAL库函数简介(F1/F4/F7/H7) 4.编程实战 …

云岚到家项目100问 v1.0

云岚到家项目100问 v1.0 第一章 运营基础管理 你的项目是做什么业务的? 家政服务,我的项目是一个家政o2o平台。 项目涉及哪些角色? 本项目涉及如下角色: 家政需求方:通过用户端小程序完成在线预约下单、支付、评价、…