O(1) 的哈希
Python中的哈希表主要通过内置的字典(dict)类型实现。对于字典的操作,包括插入(insert)、删除(delete)和查找(lookup)的时间复杂度,在理想情况下可以视为O(1),即常数时间复杂度。这是因为哈希表通过哈希函数将键(key)直接映射到表中的某个位置,理论上可以做到直接访问。
然而,这是在假设哈希函数能够均匀分布元素,且哈希表有足够的空间以保持低冲突率的理想情况下的讨论。实际情况可能会受到以下因素的影响:
哈希冲突:当不同的键通过哈希函数映射到相同的索引时,就会发生冲突。Python字典通过开放寻址法或链地址法解决冲突。即使在处理冲突的情况下,设计良好的哈希表也能保持接近O(1)的平均时间复杂度,但最坏情况下时间复杂度可能退化到O(n),特别是在哈希表过于拥挤(即负载因子很高)时。
动态调整大小:为了维持高效的查找性能,当字典中元素数量超过一定阈值时,Python字典会自动进行扩容,重新哈希所有元素。这个过程会暂时增加插入和删除操作的时间复杂度,但总体上是为了长期维持O(1)的平均查找性能。
总结来说,对于Python字典(哈希表)的插入、删除和查找操作,在大多数实际应用场景中可以认为是O(1)的,但要注意这是平均情况下的复杂度,极端情况或在特定操作序列下性能可能会有所下降。
题目:
1 两数之和:
. - 力扣(LeetCode)
给定一个整数数组 nums
和一个整数目标值 target
,请你在该数组中找出 和为目标值 target
的那 两个 整数,并返回它们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素在答案里不能重复出现。你可以按任意顺序返回答案。
思考:
输入: 序列nums, 两数之和: sum
两数之和 sum,找到其中一个x,判断另外一个 sum-x 是否在也在数组中即可;
如何做?
遍历访问x : nums,
判断 sum-x in nums[i+1:]: 如果满足的话,那么一定存在,但是list lookup时间复杂度是 o(n);
解决方案:
不从list中访问,从字典中访问:
d = defaultdict(int) # 存放 {num : index}
for i, num in enumerate(nums):
if sum - num in d: 当前的数、以及sum - num 是否在字典中:
return [i,d[sum - num ]]
else:
d[num] = i
时间复杂度 O(N), 空间复杂度O(N)
2 字母异位分组
给你一个字符串数组,请你将 字母异位词 组合在一起。可以按任意顺序返回结果列表。
字母异位词 是由重新排列源单词的所有字母得到的一个新单词。
输入: strs =["eat", "tea", "tan", "ate", "nat", "bat"]
输出: [["bat"],["nat","tan"],["ate","eat","tea"]] 思考: 同一个分组具有相同的字符串;给一个字典: {key: list()}, key 就是同一个分组的字符串;
3 最长连续序列
给定一个未排序的整数数组
nums
,找出数字连续的最长序列(不要求序列元素在原数组中连续)的长度。请你设计并实现时间复杂度为
O(n)
的算法解决此问题。示例 1:
输入:nums = [100,4,200,1,3,2] 输出:4 解释:最长数字连续序列是[1, 2, 3, 4]。它的长度为 4。
示例 2:
输入:nums = [0,3,7,2,5,8,4,6,0,1] 输出:9最长连续序列:
假设访问到 num 是一个序列中的最小值,如果num 不是最小边界,则继续编列,说明这个数是一个序列中的一个;