Redis基础篇5-set类型

新的存储需求：存储大量的数据，在查询方面提供更高的效率

需要的存储结构：能够保存大量的数据，高效的内部存储机制，便于查询

set类型：与hash存储结构完全相同，仅存储键，不存储值（nil），并且值是不允许重复的

分析

list缺点：list内部存储是链表结构，效率低

set类型数据的基本操作

添加数据

sadd key member1 [member2]

获取全部数据

smembers key

删除数据

srem key member1 [member2]

获取集合数据总量

scard key

判断集合中是否包含指定数据

sismember key member

set类型数据到的扩展操作

业务场景

每位用户首次使用今日头条时会设置3项爱好的内容，但是后期为了增加用户的活跃度，兴趣点，必须让用户对其他信息类别逐渐产生兴趣，增加客户留存度

业务分析

1.系统分析各个分类的最新或最热点信息条目并组织成set集合

2.随机挑选其中部分信息

3.配合用户关注信息分类中的热点信息组织成展示的全信息集合

解决方案

1.随机获取集合中指定数量的数据

srandmember key [count]

2.随机获取集合中的某个数据并将该数据移出集合

spop key number

sadd news n1
sadd news n2
sadd news n3
sadd news n4
srandmember news 1

Tips8:redis应用于随机推荐类信息检索，例如热点歌单推荐，热点新闻推荐，热卖旅游线路，应用APP推荐。

业务场景

微信中某个好友拥有多少个共同好友，关注微博用户拥有多少个朋友关注

解决方案

求两个集合的交，并，差集

sinter key1 [key2]
sunion key1 [key2]
sdiff key1 [key2]

求两个集合的交，并，差集并存储到指定集合中

sinterstore destination key1 [key2]
sunionstore destination key1 [key2]
sdiffstore destination key1 [key2]

将指定数据从原始集合中移动到目标集合中

smove source destination member

127.0.0.1:端口号> sadd u1 a1
(integer) 1
127.0.0.1:端口号> sadd u1 s1
(integer) 1
127.0.0.1:端口号> sadd u1 b1
(integer) 1
127.0.0.1:端口号> sadd u2 s1
(integer) 1
127.0.0.1:端口号> sadd u2 w1
(integer) 1
127.0.0.1:端口号> sinter u1 u2
1) "s1"
127.0.0.1:端口号> sunion u1 u2
1) "w1"
2) "s1"
3) "a1"
4) "b1"
127.0.0.1:端口号> sdiff u2 u1
1) "w1"
127.0.0.1:端口号> sinterstore u3 u1 u2               #u1与u2交集存储到u3
(integer) 1
127.0.0.1:端口号> smembers u3            
1) "s1"
127.0.0.1:端口号> smove u2 u1 w1                    #u2的w1移动到u1
(integer) 1
127.0.0.1:端口号> smembers u1
1) "w1"
2) "s1"
3) "b1"
4) "a1"

Tips9:

1.redis应用于同类信息的关联搜索，深度关联搜索

2.显示共同关注（一度）

3.显示共同好友（一度）

4.由用户A出发，获取好友用户B的好友信息列表

5.由用户A出发，获取好友用户B的购物清单列表

6.由用户A出发，获取好友用户B的游戏充值列表

set类型数据操作的注意事项

1.set类型不允许数据重复，如果添加的数据在set中已经存在，将只保留一份

2.set虽然与hash的存储结构相同，但是无法启动hash中存储值得空间

业务场景1

集团公司具有12000名员工，内部OA系统中矩有700多个角色，3000多个业务操作，23000多种数据，每位员工具有一个或多个角色，如何快速进行业务操作的权限校验？

解决方案

1.依赖set集合数据不重复的特征，依赖set集合hash存储结构特征完成数据过滤与快速查询

2.根据用户id获取用户所有角色

3.根据用户所有角色获取用户所有操作权限放入set集合

4.根据用户所有角色获取用户所有数据全选放入set集合

演示

校验工作：redis提供基础数据还是提供校验结果？

sadd rid:001 getall                         #模块getall 角色1
sadd rid:001 getById
sadd rid:002 getCount                         #角色2
sadd rid:002 getall
sadd rid:002 insert
sunionstore uid:007 rid:001 rid:002                           #合并
smembers uid:007                               #查看
#可编程判断新角色使用的模块是否在其中，在则可以调用

第一种：校验业务操作放到程序中进行，耦合度较低

sismember uid:007

第二种：校验业务操作放到存入数据中进行，耦合度较高

个人推荐使用第一种

Tips10:

redis应用于同类型不重复数据的合并操作

业务场景2

公司对旗下新的网站做推广，统计网站的PV（访问量），UV（独立访客），IP（独立IP）

PV:网站被访问次数，可通过刷新页面提高哦访问量

UV:网站被不同用户访问的次数，可通过cookie统计访问量，相同用户切换IP地址，UV不变

IP:网站被不同IP地址访问的总次数，可通过IP地址统计访问量，相同IP不同用户访问，IP不变

解决方案

1.利用set集合的数据去重特征，记录各种访问数据

2.建立string类型数据，利用incr统计日访问量（PV）

3.建立set模型，记录不同cookie数量（UV）

4.建立set模型，记录不同IP数量（IP）

Tips11：

redis应用于同类型数据的快速去重

业务场景3

黑名单，爬虫带来的伪流量，在基于技术层面区分出爬虫用户后，需要将此类用户进行有效的屏蔽，这就是黑名单的典型应用

白名单，需要设定可访问的用户群体，依赖白名单做更为苛刻的访问验证。

解决方案

1.基于经营战略设定问题用户发现，鉴别规则

2.周期性更新满足规则的用户黑名单，加入set集合

3.用户行为信息达到后于黑名单进行比对，确认行为去向

4.黑名单过滤IP地址：应用于开放游客访问权限的信息源

5.黑名单过滤设备信息：应用于限定访问设备的信息源

6.黑名单过滤用户：应用于基于访问权限的信息源

Tips12:

redis应用于基于黑名单于白名单设定的服务控制