HashMap源码分析jdk1.7

Sshm_666

已于 2022-06-30 13:40:29 修改

阅读量665

点赞数

文章标签：哈希算法 java 算法

于 2022-06-30 10:42:09 首次发布

本文链接：https://blog.csdn.net/m566666/article/details/125535033

版权

jdk1.7的hashmap是根据数组+链表的方式进行存储的。

数组下标是根据计算的hash值和数组长度算出来的（防止越界）。

链表存储的方式是头插法。

下面是我整理出的put时的流程图：

hashmap的重要属性：

//1. HashMap的K, v的值,在创建对象的时候确定: K: Integer V:String
//HashMap的父类AbstractMap已经实现类Map接口,但是源码中又单独实现了Map接口
//这个操作就是-一个多余的操作-->集合的创作者 承认了
public class HashMap<K,V> extends AbstractMap<K,V>
	implements Map<K,V>, Cloneable, Serializable {
//默认初始化化容量,即16  
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; 

//最大容量，即2的30次方  
static final int MAXIMUM_CAPACITY = 1 << 30;  

//默认加载因子  
static final float DEFAULT_LOAD_FACTOR = 0.75f;  

//HashMap内部的存储结构是一个数组，此处数组为空，即没有初始化之前的状态  
static final Entry<?,?>[] EMPTY_TABLE = {};  

//空的存储实体  
transient Entry<K,V>[] table = (Entry<K,V>[]) EMPTY_TABLE;  

//HashMap的元素数目  
transient int size;  

//HashMap下次扩容是的阀值，threshold = 初始容量 * 加载因子
int threshold;  

//HashMap的加载因子  
final float loadFactor;  

//修改次数  
transient int modCount;  

//最大的扩容阈值
static final int ALTERNATIVE_HASHING_THRESHOLD_DEFAULT = Integer.MAX_VALUE;

//hash总值，默认为0，目的使hash更复杂，结果更散列 
transient int hashSeed = 0;

构造方法：

//容量取16，加载因子取0.75，构造HashMap  
public HashMap() {  
    this(DEFAULT_INITIAL_CAPACITY, DEFAULT_LOAD_FACTOR);  
} 

//通过加载因子构造HashMap,容量取默认值，即16  
public HashMap(int initialCapacity) {  
    this(initialCapacity, DEFAULT_LOAD_FACTOR);  
} 
  
//通过初始容量和加载因子构造HashMap  
public HashMap(int initialCapacity, float loadFactor) {  
    if (initialCapacity < 0)//初始容量不能小于0
        throw new IllegalArgumentException("Illegal initial capacity: " +  
                                           initialCapacity);  
    if (initialCapacity > MAXIMUM_CAPACITY)//最大容量不能大于2的30次方 
        initialCapacity = MAXIMUM_CAPACITY;  
    if (loadFactor <= 0 || Float.isNaN(loadFactor))//加载因子必须为数字，并且不能小于0
        throw new IllegalArgumentException("Illegal load factor: " +  
                                           loadFactor);  

    this.loadFactor = loadFactor;  
    threshold = initialCapacity;  
    init();//这个实现为空，LinkedHashMap会使用 
} 

//通过其他Map来初始化HashMap,容量通过其他Map的size来计算，装载因子取0.75  
public HashMap(Map<? extends K, ? extends V> m) {  
    this(Math.max((int) (m.size() / DEFAULT_LOAD_FACTOR) + 1,  
                  DEFAULT_INITIAL_CAPACITY), DEFAULT_LOAD_FACTOR);  
    inflateTable(threshold);//初始化HashMap底层的数组结构  
    putAllForCreate(m);//添加m中的元素  
}

初始化HashMap方法：选取初始加载容量为：大于等于传入容量的2的幂次方。比如传入容量为6，那么实际初始化容量为8。

//初始化HashMap的底层数据结构  
private void inflateTable(int toSize) {
    int capacity = roundUpToPowerOf2(toSize);//选取合适的容量值
    
    threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1);//选取合适的threshold（扩容阀值）
    table = new Entry[capacity];//初始化底层数据结构
    initHashSeedAsNeeded(capacity);//选择合适的Hash总值，这里和虚拟机的配置有关
}  

//选择合适的容量值，容量值取大于等于最接近number的2的冪数  
private static int roundUpToPowerOf2(int number) {
    // 如果传入容量超出了最大值，则采用最大值。如果小于1，则容量使用1
    // 其余情况：容量 <= 最接近容量的2的幂数，比如 容量 10=>16,  16=>16
    /*
    * 假设传入值为10：
    *   首先，计算(number - 1) << 1，也就是(10-1) << 1 = 18，number - 1是为了防止特殊情况，比如number = 16
    *   然后调用Integer.highestOneBit(18)，最终返回为16.
    *        二进制                十进制
    *       0001 0010               18
    *       0001 1111               31          首先，将最高位之后所有位转换为1
    *       0000 1111               15          右移一位之后，相减也就是 （11111）2 - （1111）2 => 31 - 15 = 16
    *       ----------------------------
    *       0000 1111               16
    * */
    return number >= MAXIMUM_CAPACITY  ?
            MAXIMUM_CAPACITY  : (number > 1) ? Integer.highestOneBit((number - 1) << 1) : 1;
}

hash的计算方式：

//计算key的Hash值，这里针对String类的Key优化了Hash函数
final int hash(Object k) {  
    int h = hashSeed;  //hash总值，初始值为0
    if (0 != h && k instanceof String) {//这里针对String优化了Hash函数，是否使用新的Hash函数和Hash因子有关  
        return sun.misc.Hashing.stringHash32((String) k);  
    }  
    /*
    * 这里将获取到的hashCode值>>>和^，是为了更好的平均分配定位hash桶位置索引，让高位的二进制数参与到定位hash桶位置的运算中。
    * */
    h ^= k.hashCode();  
    h ^= (h >>> 20) ^ (h >>> 12);  
    return h ^ (h >>> 7) ^ (h >>> 4);  
}

使用下面的方法计算放在数组的下标位置，为了防止根据hash值计算出来的下标越界：

//根据Hash值和Hash表的大小选择合适的Hash桶  
static int indexFor(int h, int length) {
    /*
    * 返回需要保证两个条件：
    *       1.返回值小于length
    *       2.分配平均
    * 假设hash为17，传入容量为10，经过计算之后的容量为16，那么返回值就为 17 & (16 - 1)
    *       二进制             十进制
    *       0001 0001           17
    *       0000 1111           15
    *   &
    * -----------------------------
    *       0000 0001           1
    * */
    return h & (length-1);  
}

put方法
如果底层数组为空，则会先初始化底层数组，默认容量为16。定位Hash桶位置，并且遍历该链表下的所有节点，如果有节点和插入节点的key相同，就覆盖该节点，并且返回旧的value，如果没有key相同，那么就会采用头插法，将该节点插入。
如果key为空，则执行空的逻辑，说明HashMap可以存放key为null的元素，该元素默认存放在数组下标为0的链表中。

//添加元素  
public V put(K key, V value) {  
    if (table == EMPTY_TABLE) {//具体看：容量计算方法
        inflateTable(threshold);
    }  
    if (key == null)//如果key为空，则执行空的逻辑，说明HashMap可以存放key为null的元素
        return putForNullKey(value);  
    int hash = hash(key);//获取key的Hash值  
    int i = indexFor(hash, table.length);//定位Hash桶  
    //如果放入的数组的位置上没有元素的话，那么直接添加就行了,不用走这个for循环
    for (Entry<K,V> e = table[i]; e != null; e = e.next) {//定位到hash桶的链表上，是否有key相同的元素，如果有返回并修改旧值
        Object k;
        //发生哈西碰撞的时候,会先比较哈希值
		//比较key是否是一一个对象，如果key是一-个对象的话,equals就不比较了
		//如果不是同一个对象,会比较equals方法
		//如果hash值- -样，equals方法比较的结果也一-样，那么才会走这个if方法:
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {//hash相同，并且key相同
            V oldValue = e.value;  //获取老的value
            e.value = value;//新值覆盖旧值-->只替换value不替换key
            e.recordAccess(this);//调用value的回调函数，其实这个函数也为空实现  
            return oldValue;//返回旧值
        }  
    }  

    modCount++;//更新修改次数  
    addEntry(hash, key, value, i);//添加到对应Hash桶的链接表中，头插法
    return null; //如果该key以前没有被添加过，则返回null
}

addEntry()添加新元素:

void addEntry(int hash, K key, V value, int bucketIndex) {
      // 当数组的size >= 扩容阈值，触发扩容，size大小会在createEnty和removeEntry的时候改变
      if ((size >= threshold) && (null != table[bucketIndex])) {
          // 扩容到2倍大小，后边会跟进这个方法
          resize(2 * table.length);
          // 扩容后重新计算hash和index
          hash = (null != key) ? hash(key) : 0;
          bucketIndex = indexFor(hash, table.length);
      }
      // 创建一个新的链表节点，点进去可以了解到是将新节点添加到了链表的头部
      createEntry(hash, key, value, bucketIndex);
  }
//头插法插入新节点
 void createEntry(int hash, K key, V value, int bucketIndex) {
              Entry<K,V> e = table[bucketIndex];
              table[bucketIndex] = new Entry<>(hash, key, value, e);
              size++;   //标记table数组中已存储key-val的个数，为了判断是否需要扩容
        
  }

hash的扩容：

//执行扩容
void resize(int newCapacity) {  
    Entry[] oldTable = table;//老的数据  
    int oldCapacity = oldTable.length;//获取老的容量值  
    if (oldCapacity == MAXIMUM_CAPACITY) {//老的容量值已经到了最大容量值  
        threshold = Integer.MAX_VALUE;//修改扩容阀值  
        return;  
    }  
    //新的结构  
    Entry[] newTable = new Entry[newCapacity];  
    transfer(newTable, initHashSeedAsNeeded(newCapacity));//将老的数据拷贝到新的结构中。initHashSeedAsNeeded为是否使用hash总值，与虚拟机配置有关，默认为false
    table = newTable;//修改HashMap的底层数组  
    threshold = (int)Math.min(newCapacity * loadFactor, MAXIMUM_CAPACITY + 1);//修改阀值  
} 
//将老的数据拷贝到新的结构中  
void transfer(Entry[] newTable, boolean rehash) {  
    int newCapacity = newTable.length;//新的容量  
    for (Entry<K,V> e : table) {  
        while(null != e) {  
            Entry<K,V> next = e.next;  
            if (rehash) {
                e.hash = null == e.key ? 0 : hash(e.key);  
            }  
            int i = indexFor(e.hash, newCapacity);//定位Hash桶，计算的结果可能为：初始位置 或者 初始位置 + 扩容量
            e.next = newTable[i];//扩容插入也会采用头插法，与旧的hash桶相比链表的顺序可能会被颠倒，并且分散到 初始位置 和 初始位置 + 扩容量两个位置中
            newTable[i] = e;  
            e = next;  
        }  
    }  
}

get方法：

public V get(Object key) {
        
        if (key == null)
            return getForNullKey();
        //获取Key为key的键值对
        Entry<K,V> entry = getEntry(key);
        
        return null == entry ? null : entry.getValue();
    }
 
 
final Entry<K,V> getEntry(Object key) {
        if (size == 0) {
            return null;
        }
 
        int hash = (key == null) ? 0 : hash(key);
        for (Entry<K,V> e = table[indexFor(hash, table.length)];
             e != null;
             e = e.next) {
            Object k;
            if (e.hash == hash &&
                ((k = e.key) == key || (key != null && key.equals(k))))
                return e;
        }
        return null;
    }
 
private V getForNullKey() {
        if (size == 0) {
            return null;
        }
        for (Entry<K,V> e = table[0]; e != null; e = e.next) {
            if (e.key == null)
                return e.value;
        }
        return null;
    }