MongoDB的索引与聚合

embedded/2025/1/23 19:36:01/

一、实验目的

1.  理解索引的概念及其在MongoDB中的重要性和作用。

2.  学习如何选择适合建立索引的字段。

3.  掌握如何创建、删除索引以及如何强制使用索引。

4.  熟悉MongoDB的聚合框架和MapReduce工具,以及简单聚合命令的使用。

二、实验环境准备

1.  JAVA环境准备:确保Java Development Kit (JDK) 已安装并配置好环境变量。

2.  Hadoop环境准备:安装并配置Hadoop环境,确保Hadoop的各个组件可以在伪分布式模式下运行。

三、实验教材参考

《大数据存储》,谭旭,人民邮电出版社,2022,ISBN 978-7-115-59414-3。

四、实验内容与步骤

1、索引操作

1. 创建文档并插入数据

db.createCollection("studata")
db.studata.insert({
name:"Alice",
age:22,
score:85,
class:"Physics"
})

db.studata.insert([{ name: "Alice", age: 22, score: 85, class: "Physics" },
{ name: "Bob", age: 21, score: 78, class: "Chemistry" },
{ name: "Charlie", age: 23, score: 92, class: "Physics" },
{ name: "David", age: 20, score: 65, class: "Mathematics" }
]);

2. 创建单字段索引

db.studata.createIndex({age:1})

3. 创建复合索引

db.studata.createIndex({ class: 1, score: -1 });

4. 创建文本索引

db.studata.createIndex({ name: "text" });

5. 查看查询计划并评估单字段索引效果

db.studata.find({ age: 22 }).explain("executionStats");

6. 查看查询计划并评估复合索引效果

db.studata.find({ class: "Physics", score: { $gt: 80 } }).explain("executionStats");

7. 查看查询计划并评估文本索引效果

db.studata.find({ $text: { $search: "Alice" } }).explain("executionStats");

8. 删除索引

删除单字段索引

db.studata.dropIndex({ age: 1 });

删除复合索引

db.studata.dropIndex({ class: 1, score: -1 });

2、聚合工具

1. 统计文档数量

db.studata.aggregate([

  { $match: { class: "Physics" } },

  { $group: { _id: null, total_students: { $sum: 1 } } }

]);

2. 获取字段唯一值

db.studata.distinct("class");

3. 分组统计

db.studata.aggregate([

  { $group: {

      _id: "$class",

      total_students: { $sum: 1 },

      average_score: { $avg: "$score" }

  } }

]);

4. 排序和限制

按分数降序排列,取前5名

db.studata.aggregate([

  { $sort: { score: -1 } },

  { $limit: 5 }

]);

5. 使用MapReduce处理复杂的聚合任务

db.studata.mapReduce(

  function() { emit(this.class, this.score); },

  function(key, values) { return Array.sum(values); },

  {

    out: "class_total_scores"

  }

);

查看 MapReduce 结果

db.class_total_scores.find();


http://www.ppmy.cn/embedded/156384.html

相关文章

云原生前端开发:打造现代化高性能的用户体验

引言:前端开发的新风向 在过去的几年中,前端开发领域经历了快速的演变,从早期的静态网页到如今复杂的单页应用(SPA),再到微前端架构和渐进式Web应用(PWA),前端技术一直处…

Axios发起HTTP请求时的先后执行顺序

书写如下代码时&#xff0c;日志输出的顺序不可控&#xff0c;可能是"you How are"&#xff0c;也可能是"you are How" <script> import axios from axios export default {created() {this.fn1()this.fn2()console.log(you)},methods: {fn1() {axi…

C语言程序设计十大排序—插入排序

文章目录 1.概念✅2.插入排序&#x1f388;3.代码实现✅3.1 直接写✨3.2 函数✨ 4.总结✅5.十大排序 1.概念✅ 排序是数据处理的基本操作之一&#xff0c;每次算法竞赛都很多题目用到排序。排序算法是计算机科学中基础且常用的算法&#xff0c;排序后的数据更易于处理和查找。在…

通过以太网加载linux内核、设备树、根文件系统方法(以stm32MP135为例)

0 硬件平台 正点原子stm32MP135开发板 1 通过以太网加载linux内核、设备树、根文件系统方法&#xff08;以stm32MP135为例&#xff09; 在产品正式发布前&#xff0c;为了调试方便&#xff0c;我们可以使用以太网加载linux内核、设备树、根文件系统以加快调试速度。本文以stm3…

论文笔记-NeruIPS2024-LLM-ESR

论文笔记-NeruIPS2024-LLM-ESR: Large Language Models Enhancement for Long-tailed Sequential Recommendation LLM-ESR&#xff1a;用于长尾序列推荐的大模型增强摘要1.引言2.问题定义3.LLM-ESR3.1概述3.2双视图建模3.2.1语义视图建模3.2.2协同视图建模3.2.3两级融合 3.3检索…

centos下设置服务器开机自启动 redis

在客户服务器中&#xff0c;服务器重启&#xff0c;发现 Redis 没有重启&#xff0c; 可以按照类似的步骤来创建自启动脚本&#xff0c;并将它添加到定时任务中。 解决办法&#xff1a; 1. 创建自启动脚本 进入服务器并创建脚本文件&#xff0c;例如 /usr/local/bin/redis_…

类和对象——类的对象占用内存的大小计算

类的对象大小的计算 类的对象大小的计算1 案例分析2 如何计算类对象的大小案例分析中的猜测结构体内存对齐规则 类的对象大小的计算 1 案例分析 #include<iostream>class Date { public:void Init(int year, int mouth, int day) {year year;_mouth mouth;day_ day;…

HTML知识点复习

1.src 和 href 的区别 src&#xff1a;表示对资源的引用&#xff0c; src指向的内容会嵌入到其标签里。 当浏览器解析到该元素时候&#xff0c;会暂停其他资源的下载和处理&#xff0c; 直到将该资源加载、编译、执行完毕&#xff0c;所以js脚本一般会放在页面底部 href&…