随机数种子(seed)

news/2024/11/8 20:39:33/

在科学技术和机器学习等其他算法相关任务中,我们经常需要用到随机数,为了把握随机数的生成特性,从随机数的随机无序中获得确定和秩序。我们可以利用随机数种子(random seed)来实现这

一目标,随机数种子,可以使得引入了随机数的整个程序,在多次运行中得到确定的,一致的结果。

1. 随机数种子

python自带的random函数:

import random
# print(help(random))
def test_random_seed_in_std_lib(seed=0, cnt=3):random.seed(seed)print("test seed: ", seed)for _ in range(cnt):print(random.random())print(random.randint(0,100))print(random.uniform(1, 10))print('\n')
test_random_seed_in_std_lib()
test seed:  0
0.8444218515250481
97
9.012195287534180.04048437818077755
65
5.3733492690653140.9182343317851318
38
9.710199954281542
test_random_seed_in_std_lib()
test seed:  0
0.8444218515250481
97
9.012195287534180.04048437818077755
65
5.3733492690653140.9182343317851318
38
9.710199954281542
test_random_seed_in_std_lib(100)
test seed:  100
0.1456692551041303
58
9.5654593254406310.17474750209982115
50
7.5876307572993010.43351443489540376
14
5.7961127317831425

通过两次运行以上程序,我们得到相同的结果,这说明了以下几点:

  1. 在确定了一次随机数种子后,随机数函数,无论任何分布任何类型,在多次重复调用中(for循环)生成的随机数不同;
  2. 当再次声明相同的随机数种子时(第二次调用test_random_seed_in_std_lib函数,random.seed(seed)这一行),随机数将从“头”开始, 按相同的顺序生成随机数。这里的“头”,即是random.seed(seed)声明后,随机数函数的首次调用;
  3. 若指定不同的随机数种子(seed=100),无论任何随机数函数,生成的随机数将不同于,之前的(随机数种子为0)的运行结果。

上面的几点解释了随机数种子可以使得每次生成相同随机数的具体含义。这里的相同,其实还有一种更普遍的内涵,即环境独立和跨平台。上面的实验,在任何电脑或主机,运行以上代码,可以复现完全一致的结果。

以上几点囊括了随机数种子的基本特性,下面我们来对numpy中的随机数种子作进一步的拓展研究。

2. numpy中随机数种子

import numpy as np
def test_numpy_random_seed(seed=0, cnt=3):np.random.seed(seed)print("test numpy seed: ", seed)for _ in range(cnt):print(np.random.random())print(np.random.randn(1, 5))print(np.random.uniform(1, 10, 5))print('\n')

多次运行以上的test_numpy_random_seed函数,你可以观察到与使用random模块时相似的情形,进一步验证了我们总结的关于随机数种子的特性。

此外,我们可以对多维随机数组做一些有益的探索:

import numpy as npdef test_mult_shape(seed=0):np.random.seed(seed)print(np.random.randn(1, 3))print(np.random.randn(1, 2))np.random.seed(seed)print(np.random.randn(2, 5))test_mult_shape()
[[1.76405235 0.40015721 0.97873798]]
[[2.2408932  1.86755799]]
[[ 1.76405235  0.40015721  0.97873798  2.2408932   1.86755799][-0.97727788  0.95008842 -0.15135721 -0.10321885  0.4105985 ]]

运行test_mult_shape()函数,我们发现,设定相同的随机数组,两次运行两个一行的多维正态分布的结果,与一次运行两行的多维正态分布的结果的第一行完全相同。

这个结果,说明了对相同类型的随机数分布,形状特征不会影响分布的生成秩序,程序中,np.random.randn(1, 2),这一行不像是第二次运行多维正态分布的随机数组,它"几乎"是后缀于它的前一行一次性生成的。

3. 随机数“顺序”的奥秘

至此,我们对随机数生成顺序有了初步印象,但是这里的顺序,其实比我们的朴素观察更复杂,我们来进一步考察这一点。

def test_numpy_random_seed_order(seed=0):np.random.seed(seed)print(np.random.random())# print(np.random.randint(1, 10))print(np.random.randn(1, 5))np.random.seed(seed)print(np.random.randn(2, 5))test_numpy_random_seed_order()
0.5488135039273248
[[ 0.74159174  1.55291372 -2.2683282   1.33354538 -0.84272405]]
[[ 1.76405235  0.40015721  0.97873798  2.2408932   1.86755799][-0.97727788  0.95008842 -0.15135721 -0.10321885  0.4105985 ]]

运行以上程序,我们看到,设定了相同的随机数种子,np.random.randn(1, 5)看起来是第一次运行多维正态分布数组,实际上并不是,np.random.randn(2, 5)才是真正的第一次运行多维正态分布随机数组。

这说明,前面的np.random.random()对np.random.randn产生了干扰,使得这次正态分布的随机数组中的任何一个数,都不在np.random.randn(2, 5)中,这样它显示了一种不可把握的随机性。

我们可以把这一点考察得更加深入一点:

import numpy as npdef test_numpy_random_seed_order_further(seed=0, randint_high=10):np.random.seed(seed)print(np.random.randint(1, randint_high))print(np.random.randn(1, 5))np.random.seed(seed)print(np.random.randn(2, 5))test_numpy_random_seed_order_further()
6
[[ 0.11849646  0.11396779  0.37025538  1.04053075 -1.51698273]]
[[ 1.76405235  0.40015721  0.97873798  2.2408932   1.86755799][-0.97727788  0.95008842 -0.15135721 -0.10321885  0.4105985 ]]
test_numpy_random_seed_order_further(randint_high=5)
1
[[ 1.12279492  0.30280522  0.07085926  0.07304142 -1.42232584]]
[[ 1.76405235  0.40015721  0.97873798  2.2408932   1.86755799][-0.97727788  0.95008842 -0.15135721 -0.10321885  0.4105985 ]]

紧接上面对随机数干扰项对考察,我们看到,这次我们改变了干扰项随机数生成器,np.random.randn(1, 5)的生成结果不同于test_numpy_random_seed_order中同一行的运行结果。

另外,两次设置不同的randint的右边界,np.random.randn(1, 5)生成的结果也全然不同,这说明了np.random.randint设置不同的参数,即是全然不同的随机数发生器。这一点,也不难在其他类型的随机数分布中得到验证。


http://www.ppmy.cn/news/357431.html

相关文章

java 随机数种子 java设置随机数种子教程 java随机数种子怎么设置

我们常用的随机数生成就是Math.random(); java.util.Random类有两种方式构建方式:带种子和不带种子 import java.util.Random; 不带种子: 不带种子将会返回随机的数字,每次运行结果不一样 public class RandomTest { public stati…

随机数和随机数种子

随机数rand(); 随机数种子 srand(); 在运行程序代码的时候我们可能会需要大量数据来测试我们的程序是否正确,如果主观输入,缺点很多,如果可以让计算机自动生成数据提供给我们测试就会好很多。 如果你多次运行完代码之后就会发现一个问题&am…

随机种子讲解

在使用numpy时,难免会用到随机数生成器。我一直对np.random.seed(),随机数种子搞不懂。很多博客也就粗略的说,利用随机数种子,每次生成的随机数相同。 我有两个疑惑:   1, 利用随机数种子,每次生成的随机…

详细介绍随机种子

前言 从入职到现在一直在使用随机数,只知道在使用随机数时,需要先设置一下随机种子,但却不知道为什么要这么做,知其然不知其所以然,今天刚好又用到了,然后就想彻底搞明白 伪随机数 其实我们现在很多地方…

SUMO 随机种子

附上官网指南,FAQ - SUMO Documentation 默认情况下,即使模拟的许多部分是随机的,相同的配置也会导致相同的行为。要更改这一点,必须使用选项--seed或选项--random 为了从多次运行中收集不同的输出,建议设置选项--o…

IRIS鸢尾花数据集(多种格式)-下载地址

最近看的例子有用到IRIS数据集, 个人找了半天,才找到合适格式的数据集。 因此,将我找到的数据集分享给大家,以免大家像我一样找很久。 我这里有3种格式的数据集,分别是: 1. iris.csv 2. Iris.data 3.…

随机种子的详解

什么是随机种子? 我们知道,随机数是通过一些复杂的数学算法得到的,那么 随机种子(Random Seed)就是这些随机数的初始值。 一般计算机里面产生的随机数都是伪随机数。 伪随机数,也是就一个一直不变的数。 …

7.3.随机种子

导入第三方库以及相关设置 import numpy as np from numpy import random import matplotlib.pyplot as plt%matplotlib inline# 解决中文乱码 plt.rcParams["font.sans-serif"]["KaiTi"] plt.rcParams["font.family"]"sans-serif"# …