MD5

MD5
MD5
Создан	1991г.
Опубликован	апрель1992г.
Предшественник	MD4
Преемник	SHA-2
Стандарты	RFC 1321
Размер хеша	128 бит
Число раундов	4
Тип	хеш-функция

MD5(англ.Message Digest 5) —128-битныйалгоритмхеширования,разработанный профессоромРональдом Л. РивестомизМассачусетского технологического института(Massachusetts Institute of Technology, MIT) в1991 году.Предназначен для создания «отпечатков» илидайджестов сообщенияпроизвольной длины и последующей проверки их подлинности. Широко применялся для проверкицелостности информациии хранения хешей паролей.

История

MD5 — один из серии алгоритмов по построениюдайджеста сообщения,разработанный профессоромРональдом Л. Ривестомиз Массачусетского технологического института. Был разработан в 1991 году как более надёжный вариант предыдущего алгоритмаMD4^[1].Описан вRFC 1321^[2].ПозжеГансом Доббертиномбыли найдены недостатки алгоритма MD4.

В 1993 году Берт ден Бур (Bert den Boer) и Антон Босселарс (Antoon Bosselaers) показали, что в алгоритме возможны псевдоколлизии, когда разным инициализирующим векторам соответствуют одинаковые дайджесты для входного сообщения^[3].

В 1996 году Ганс Доббертин (Hans Dobbertin) объявил о коллизии в алгоритме^[4],и уже в то время было предложено использовать другие алгоритмы хеширования, такие какWhirlpool,SHA-1илиRIPEMD-160.

Из-за небольшого размера хеша в 128 бит можно рассматриватьbirthday-атаки.В марте 2004 года был запущен проект MD5CRK с целью обнаружения уязвимостей алгоритма, при помощиbirthday-атаки.Проект MD5CRK закончился 17 августа 2004 года, когдаВан Сяоюнь(Wang Xiaoyun), Фэн Дэнго (Feng Dengguo),Лай Сюэцзя(Lai Xuejia) и Юй Хунбо (Yu Hongbo) обнаружили уязвимости в алгоритме^[5].

1 марта 2005 годаАрьен Ленстра,Ван Сяоюнь и Бенне де Вегер продемонстрировали построение двух документовX.509с различными открытыми ключами и одинаковым хешем MD5^[6].

18 марта 2006 года исследовательВластимил Клима(Vlastimil Klima) опубликовал алгоритм, который может найти коллизии за одну минуту на обычном компьютере, метод получил название «туннелирование»^[7].

В конце 2008 годаUS-CERTпризвал разработчиков программного обеспечения, владельцев веб-сайтов и пользователей прекратить использовать MD5 в любых целях, так как исследования продемонстрировали ненадёжность этого алгоритма^[8].

24 декабря 2010 года Тао Се (Tao Xie) и Фэн Дэнго (Feng Dengguo) впервые представили коллизию сообщений длиной в один блок (512 бит)^[9]. Ранее коллизии были найдены для сообщений длиной в два блока и более. Позднее Марк Стивенс (Marc Stevens) повторил успех, опубликовав блоки с одинаковым хешем MD5, а также алгоритм для получения таких коллизий^[10].

В 2011 году был опубликован информационный документRFC 6151.Он признаёт алгоритм хеширования MD5^[2]небезопасным для некоторых целей и рекомендует отказаться от его использования в пользу SHA-2.

Алгоритм MD5

Схема работы алгоритма MD5. F — нелинейная функция.M_iобозначает 32-битный блок входного сообщения, а*K_i*— 32-битную константу. <<<_sобозначаетциклический сдвиг влевонаsбит. $\boxplus$ обозначает сложение по модулю 2³².F зависит от раунда,*K_i*иsменяются каждую операцию.

На вход алгоритма поступает входной поток данных, хеш которого необходимо найти. Длина сообщения измеряется в битах и может быть любой (в том числе нулевой). Запишем длину сообщения вL.Это число целое и неотрицательное. Кратность каким-либо числам необязательна. После поступления данных идёт процесс подготовки потока к вычислениям.

Ниже приведены 5 шагов алгоритма^[2]:

Шаг 1. Выравнивание потока

Сначала к концу потока дописывают единичный бит.

Затем добавляют некоторое число нулевых бит такое, чтобы новая длина потока $L'$ сталасравнимас 448 по модулю 512, ( $L'=512\times N+448$ ). Выравнивание происходит в любом случае, даже если длина исходного потока уже сравнима с 448.

Шаг 2. Добавление длины сообщения

В конец сообщения дописывают 64-битное представление длины данных (количество бит в сообщении) до выравнивания.Сначала записывают младшие 4 байта, затем старшие.Если длина превосходит $2^{64}-1$ ,то дописывают только младшие биты (эквивалентно взятию по модулю $2^{64}$ ). После этого длина потока станет кратной 512. Вычисления будут основываться на представлении этого потока данных в виде массива слов по 512 бит.

Шаг 3. Инициализация буфера

Для вычислений инициализируются четыре переменные размером по 32 бита, начальные значения которых задаются шестнадцатеричными числами (порядок байтовlittle-endian):

А = 01 23 45 67; // 67452301h
В = 89 AB CD EF; // EFCDAB89h
С = FE DC BA 98; // 98BADCFEh
D = 76 54 32 10. // 10325476h

В этих переменных будут храниться результаты промежуточных вычислений. Начальное состояние ABCD называется инициализирующим вектором.

Шаг 4. Вычисление в цикле

Определим функции и константы, которые понадобятся нам для вычислений.

Для каждого раунда потребуется своя функция. Введём функции от трёх параметров — слов, результатом также будет слово:

1-й этап:

\operatorname {FunF} (X,Y,Z)=(X\wedge Y)\vee (\neg X\wedge Z)

,

2-й этап:

\operatorname {FunG} (X,Y,Z)=(X\wedge Z)\vee (\neg Z\wedge Y)

,

3-й этап:

\operatorname {FunH} (X,Y,Z)=X\oplus Y\oplus Z

,

4-й этап:

\operatorname {FunI} (X,Y,Z)=Y\oplus (\neg {Z}\vee X)

,

где

\oplus,\wedge,\vee,\neg

побитовые логические операцииXOR,AND,ORиNOTсоответственно.

Определим таблицу констант $T[1\ldots 64]$ — 64-элементная таблица данных, построенная следующим образом: $T[n]=\operatorname {int} (2^{32}\cdot |\sin n|)$ .^[11]
Каждый 512-битный блок проходит 4 этапа вычислений по 16 раундов. Для этого блок представляется в виде массиваXиз 16 слов по 32 бита. Все раунды однотипны и имеют вид: [abcd k s i], определяемый как $a=b+((a+\operatorname {Fun} (b,c,d)+X[k]+T[i])\lll s)$ ,гдеk— номер 32-битного слова из текущего 512-битного блока сообщения, и $\ldots \lll s$ — циклический сдвиг влево наsбит полученного 32-битного аргумента. Числоsзадается отдельно для каждого раунда.

Заносим в блок данных элементnиз массива 512-битных блоков. Сохраняются значения A, B, C и D, оставшиеся после операций над предыдущими блоками (или их начальные значения, если блок первый).

AA = A

BB = B

CC = C

DD = D

Этап 1

/* [abcd k s i] a = b + ((a + F(b,c,d) + X[k] + T[i]) <<< s). */
[ABCD 0 7 1][DABC 1 12 2][CDAB 2 17 3][BCDA 3 22 4]
[ABCD 4 7 5][DABC 5 12 6][CDAB 6 17 7][BCDA 7 22 8]
[ABCD 8 7 9][DABC 9 12 10][CDAB 10 17 11][BCDA 11 22 12]
[ABCD 12 7 13][DABC 13 12 14][CDAB 14 17 15][BCDA 15 22 16]

Этап 2

/* [abcd k s i] a = b + ((a + G(b,c,d) + X[k] + T[i]) <<< s). */
[ABCD 1 5 17][DABC 6 9 18][CDAB 11 14 19][BCDA 0 20 20]
[ABCD 5 5 21][DABC 10 9 22][CDAB 15 14 23][BCDA 4 20 24]
[ABCD 9 5 25][DABC 14 9 26][CDAB 3 14 27][BCDA 8 20 28]
[ABCD 13 5 29][DABC 2 9 30][CDAB 7 14 31][BCDA 12 20 32]

Этап 3

/* [abcd k s i] a = b + ((a + H(b,c,d) + X[k] + T[i]) <<< s). */
[ABCD 5 4 33][DABC 8 11 34][CDAB 11 16 35][BCDA 14 23 36]
[ABCD 1 4 37][DABC 4 11 38][CDAB 7 16 39][BCDA 10 23 40]
[ABCD 13 4 41][DABC 0 11 42][CDAB 3 16 43][BCDA 6 23 44]
[ABCD 9 4 45][DABC 12 11 46][CDAB 15 16 47][BCDA 2 23 48]

Этап 4

/* [abcd k s i] a = b + ((a + I(b,c,d) + X[k] + T[i]) <<< s). */
[ABCD 0 6 49][DABC 7 10 50][CDAB 14 15 51][BCDA 5 21 52]
[ABCD 12 6 53][DABC 3 10 54][CDAB 10 15 55][BCDA 1 21 56]
[ABCD 8 6 57][DABC 15 10 58][CDAB 6 15 59][BCDA 13 21 60]
[ABCD 4 6 61][DABC 11 10 62][CDAB 2 15 63][BCDA 9 21 64]

Суммируем с результатом предыдущего цикла:

A = AA + A
B = BB + B
C = CC + C
D = DD + D

После окончания цикла необходимо проверить, есть ли ещё блоки для вычислений. Если да, то переходим к следующему элементу массива (n+ 1) и повторяем цикл.

Шаг 5. Результат вычислений

Результат вычислений находится в буфере ABCD, это и есть хеш. Если выводить побайтово, начиная с младшего байта A и заканчивая старшим байтом D, то мы получим MD5-хеш. 1, 0, 15, 34, 17, 18…

Псевдокод

// Все переменные — 32-битные беззнаковые целые. Все сложения выполняются по модулю 2^32.

varints[64],K[64]
varinti

// s обозначает величины сдвигов для каждой операции:
s[0..15]:={ 7, 12, 17, 22, 7, 12, 17, 22, 7, 12, 17, 22, 7, 12, 17, 22 }
s[16..31]:={ 5, 9, 14, 20, 5, 9, 14, 20, 5, 9, 14, 20, 5, 9, 14, 20 }
s[32..47]:={ 4, 11, 16, 23, 4, 11, 16, 23, 4, 11, 16, 23, 4, 11, 16, 23 }
s[48..63]:={ 6, 10, 15, 21, 6, 10, 15, 21, 6, 10, 15, 21, 6, 10, 15, 21 }

// Определяем таблицу констант следующим образом
forifrom0to63do
K[i]:=floor(2^32×abs(sin(i+1)))
endfor
// (Или просто используем заранее подсчитанные значения):
K[0..3]:={ 0xd76aa478, 0xe8c7b756, 0x242070db, 0xc1bdceee }
K[4..7]:={ 0xf57c0faf, 0x4787c62a, 0xa8304613, 0xfd469501 }
K[8..11]:={ 0x698098d8, 0x8b44f7af, 0xffff5bb1, 0x895cd7be }
K[12..15]:={ 0x6b901122, 0xfd987193, 0xa679438e, 0x49b40821 }
K[16..19]:={ 0xf61e2562, 0xc040b340, 0x265e5a51, 0xe9b6c7aa }
K[20..23]:={ 0xd62f105d, 0x02441453, 0xd8a1e681, 0xe7d3fbc8 }
K[24..27]:={ 0x21e1cde6, 0xc33707d6, 0xf4d50d87, 0x455a14ed }
K[28..31]:={ 0xa9e3e905, 0xfcefa3f8, 0x676f02d9, 0x8d2a4c8a }
K[32..35]:={ 0xfffa3942, 0x8771f681, 0x6d9d6122, 0xfde5380c }
K[36..39]:={ 0xa4beea44, 0x4bdecfa9, 0xf6bb4b60, 0xbebfbc70 }
K[40..43]:={ 0x289b7ec6, 0xeaa127fa, 0xd4ef3085, 0x04881d05 }
K[44..47]:={ 0xd9d4d039, 0xe6db99e5, 0x1fa27cf8, 0xc4ac5665 }
K[48..51]:={ 0xf4292244, 0x432aff97, 0xab9423a7, 0xfc93a039 }
K[52..55]:={ 0x655b59c3, 0x8f0ccc92, 0xffeff47d, 0x85845dd1 }
K[56..59]:={ 0x6fa87e4f, 0xfe2ce6e0, 0xa3014314, 0x4e0811a1 }
K[60..63]:={ 0xf7537e82, 0xbd3af235, 0x2ad7d2bb, 0xeb86d391 }

// Инициализация переменных:
varinta0:=0x67452301// A
varintb0:=0xefcdab89// B
varintc0:=0x98badcfe// C
varintd0:=0x10325476// D

// Подготовка: добавляем бит "1" в конец сообщения.
append"1"bittomessage
// Заметка: входные байты представлены строкой из бит,
// причем первый бит — старший (big-endian).

// Подготовка: дописываем нулевые биты, пока длина сообщения не станет сравнима с 448 по модулю 512
append"0"bituntilmessagelengthinbits≡448(mod512)
// Дописываем остаток от деления изначальной длины сообщения на 2^64
appendoriginallengthinbitsmod2^64tomessage

// Разбиваем подготовленное сообщение на 512-битные "куски":
foreach512-bitchunkofpaddedmessagedo
// и работаем с каждым по отдельности
breakchunkintosixteen32-bitwordsM[j],0≤j≤15// разбиваем "кусок" на 16 блоков по 32 бита
// Инициализируем переменные для текущего куска:
varintA:=a0
varintB:=b0
varintC:=c0
varintD:=d0
// Основные операции:
forifrom0to63do
varintF,g
if0≤i≤15then
F:=(BandC)or((notB)andD)
g:=i
elseif16≤i≤31then
F:=(DandB)or((notD)andC)
g:=(5×i+1)mod16
elseif32≤i≤47then
F:=BxorCxorD
g:=(3×i+5)mod16
elseif48≤i≤63then
F:=Cxor(Bor(notD))
g:=(7×i)mod16
F:=F+A+K[i]+M[g]// M[g] — 32 битный блок
A:=D
D:=C
C:=B
B:=B+(F<<<s[i])// Выполняем битовый сдвиг
endfor
// Прибавляем результат текущего "куска" к общему результату
a0:=a0+A
b0:=b0+B
c0:=c0+C
d0:=d0+D
endfor

varchardigest[16]:=a0appendb0appendc0appendd0// (Результат в формате little-endian)

Результат вычислений на примере языка программирования Python

importhashlib
importmath
k:int
r:int
defleft_rotate(n,b):
return((n<<b)|(n>>(32-b)))&0xffffffff

defmd5(message):
a0=0x67452301
b0=0xefcdab89
c0=0x98badcfe
d0=0x10325476

ml=len(message)*8
message=bytearray(message)
message.append(0x80)

whilelen(message)%64!=56:
message.append(0)

message+=ml.to_bytes(8,byteorder='little')

foriinrange(0,len(message),64):
chunk=message[i:i+64]

a=a0
b=b0
c=c0
d=d0

# Main loop
forjinrange(64):
if0<=j<=15:
f=(b&c)|((~b)&d)
g=j
elif16<=j<=31:
f=(d&b)|((~d)&c)
g=(5*j+1)%16
elif32<=j<=47:
f=b^c^d
g=(3*j+5)%16
elif48<=j<=63:
f=c^(b|(~d))
g=(7*j)%16

d_temp=d
d=c
c=b
b=(b+left_rotate((a+f+k[j]+int.from_bytes(chunk[4*g:4*(g+1)],byteorder='little')),r[j]))&0xffffffff
a=d_temp

a0=(a0+a)&0xffffffff
b0=(b0+b)&0xffffffff
c0=(c0+c)&0xffffffff
d0=(d0+d)&0xffffffff

return'{:08x}{:08x}{:08x}{:08x}'.format(a0,b0,c0,d0)

# Пример использования:
importhashlib
message="Hello, world!"
result=hashlib.md5(message.encode()).hexdigest()
print("MD5 хэш (hashlib):",result)

defmd5(message):
# Constants
T=[int(abs(math.sin(i+1))*2**32)&0xFFFFFFFFforiinrange(64)]
s=[[7,12,17,22]]*4+[[5,9,14,20]]*4+[[4,11,16,23]]*4+[[6,10,15,21]]*4

# Initialize variables
A,B,C,D=0x67452301,0xEFCDAB89,0x98BADCFE,0x10325476
message=bytearray(message)
length=(8*len(message))&0xFFFFFFFFFFFFFFFF
message.append(0x80)
whilelen(message)%64!=56:
message.append(0x00)
message.extend(length.to_bytes(8,byteorder='little'))

# Process message in 16-word blocks
foriinrange(0,len(message),64):
X=[int.from_bytes(message[i:i+4],byteorder='little')foriinrange(i,i+64,4)]
A_,B_,C_,D_=A,B,C,D

# Main loop
forjinrange(64):
ifj<16:
F=(B&C)|((~B)&D)
F_index=j
elifj<32:
F=(D&B)|((~D)&C)
F_index=(5*j+1)%16
elifj<48:
F=B^C^D
F_index=(3*j+5)%16
else:
F=C^(B|(~D))
F_index=(7*j)%16

dTemp=D
D=C
C=B
B=B+left_rotate((A+F+T[j]+X[F_index])&0xFFFFFFFF,s[j%4][j%4])
A=dTemp

# Update state
A=(A+A_)&0xFFFFFFFF
B=(B+B_)&0xFFFFFFFF
C=(C+C_)&0xFFFFFFFF
D=(D+D_)&0xFFFFFFFF

# Output
result=bytearray(A.to_bytes(4,byteorder='little'))
result.extend(B.to_bytes(4,byteorder='little'))
result.extend(C.to_bytes(4,byteorder='little'))
result.extend(D.to_bytes(4,byteorder='little'))
returnresult.hex()

result=md5(message.encode())
print("MD5 хэш (самостоятельная реализация):",result)

Сравнение MD5 и MD4

Алгоритм MD5 происходит от MD4. В новый алгоритм добавили ещё один раунд, теперь их стало 4 вместо 3 в MD4. Добавили новую константу для того, чтобы свести к минимуму влияние входного сообщения, в каждом раунде на каждом шаге и каждый раз константа разная, она суммируется с результатом F и блоком данных. Изменилась функция $G=XZ\vee (Y\neg Z)$ вместо $XY\vee XZ\vee YZ$ .Результат каждого шага складывается с результатом предыдущего шага, из-за этого происходит более быстрое изменение результата. Для этой же цели оптимизирована величина сдвига на каждом круге. Изменился порядок работы с входными словами в раундах 2 и 3^[2].

Примеры MD5-хешей

Хеш содержит 128 бит (16 байт) и обычно представляется как последовательность из 32шестнадцатеричныхцифр^[12].

Несколько примеров хеша:

MD5( "md5" ) = 1BC29B36F623BA82AAF6724FD3B16718

Даже небольшое изменение входного сообщения (в нашем случае на один бит: ASCII символ «5» с кодом 35₁₆= 000110101₂заменяется на символ «4» с кодом 34₁₆= 000110100₂) приводит к полному изменению хеша. Такое свойство алгоритма называетсялавинным эффектом.

MD5( "md4" ) = C93D3BF7A7C4AFE94B64E30C2CE39F4F

Пример MD5-хеша для «нулевой» строки:

MD5( "" ) = D41D8CD98F00B204E9800998ECF8427E

Криптоанализ

На данный момент существуют несколько видов «взлома» хешей MD5 — подбора сообщения с заданным хешем^[13]^[14]:

При этом методы перебора по словарю и brute-force могут использоваться для взлома хеша других хеш-функций (с небольшими изменениями алгоритма). В отличие от них, RainbowCrack требует предварительной подготовкирадужных таблиц,которые создаются для заранее определённой хеш-функции. Поиск коллизий специфичен для каждого алгоритма.

Атаки переборного типа

Дляполного перебораили перебора по словарю можно использовать программыPasswordsPro^[15],MD5BFCPF^[16],John the Ripper,Hashcat.Для перебора по словарю существуют готовые словари^[17].Основным недостатком такого типа атак является высокая вычислительная сложность.

RainbowCrack— ещё один метод нахожденияпрообраза хешаиз заданного множества. Он основан на генерации цепочек хешей, чтобы по получившейся базе вести поиск заданного хеша. Хотя создание радужных таблиц занимает много времени и памяти, последующий взлом производится очень быстро. Основная идея данного метода — достижениекомпромисса между временем поиска по таблице и занимаемой памятью.

Коллизии MD5

Коллизия хеш-функции— это получение одинакового значения функции для разных сообщений и идентичного начального буфера. В отличие от коллизий,псевдоколлизииопределяются как равные значения хеша для разных значений начального буфера, причём сами сообщения могут совпадать или различаться. В MD5 вопрос коллизий не решается^[14].

В 1996 годуГанс Доббертиннашёл псевдоколлизии в MD5, используя определённыеинициализирующиевекторы, отличные от стандартных. Оказалось, что можно для известного сообщения построить второе, такое, что оно будет иметь такой же хеш, как и исходное. C точки зрения математики это означает: MD5(IV,L1) = MD5(IV,L2), где IV — начальное значение буфера, а L1 и L2 — различные сообщения. Например, если взять начальное значение буфера^[4]:

A = 0x12AC2375
В = 0x3B341042
C = 0x5F62B97C
D = 0x4BA763E

и задать входное сообщение

`AA1DDABE`	`D97ABFF5`	`BBF0E1C1`	`32774244`
`1006363E`	`7218209D`	`E01C136D`	`9DA64D0E`
`98A1FB19`	`1FAE44B0`	`236BB992`	`6B7A779B`
`1326ED65`	`D93E0972`	`D458C868`	`6B72746A`

то, добавляя число $2^{9}$ к определённому 32-разрядному слову в блочном буфере, можно получить второе сообщение с таким же хешем. Ханс Доббертин представил такую формулу:

L2_{i}={\begin{cases}L1_{i},&i\neq 14;\\L1_{i}+2^{9},&i=14.\end{cases}}

Тогда MD5(IV, L1) = MD5(IV, L2) = BF90E670752AF92B9CE4E3E1B12CF8DE.

В 2004 году китайские исследователи Ван Сяоюнь (Wang Xiaoyun), Фэн Дэнго (Feng Dengguo),Лай Сюэцзя(Lai Xuejia) и Юй Хунбо (Yu Hongbo) объявили об обнаруженной ими уязвимости в алгоритме, позволяющей за небольшое время (1 час накластере IBM p690) находить коллизии^[5]^[18].

В 2005 году Ван Сяоюнь и Юй Хунбо из университета Шаньдуна в Китае опубликовали алгоритм, который может найти две различные последовательности в 128 байт, которые дают одинаковый MD5-хеш. Одна из таких пар (различающиеся разряды выделены):

`d131dd02c5e6eec4693d9a0698aff95c`	`2fcab58712467eab4004583eb8fb7f89`
`55ad340609f4b30283e488832571415a`	`085125e8f7cdc99fd91dbdf280373c5b`
`d8823e3156348f5bae6dacd436c919c6`	`dd53e2b487da03fd02396306d248cda0`
`e99f33420f577ee8ce54b67080a80d1e`	`c69821bcb6a8839396f9652b6ff72a70`

и

`d131dd02c5e6eec4693d9a0698aff95c`	`2fcab50712467eab4004583eb8fb7f89`
`55ad340609f4b30283e4888325f1415a`	`085125e8f7cdc99fd91dbd7280373c5b`
`d8823e3156348f5bae6dacd436c919c6`	`dd53e23487da03fd02396306d248cda0`
`e99f33420f577ee8ce54b67080280d1e`	`c69821bcb6a8839396f965ab6ff72a70`

Каждый из этих блоков даёт MD5-хеш, равный 79054025255fb1a26e4bc422aef54eb4^[19].

В 2006 году чешский исследователь Властимил Клима опубликовал алгоритм, позволяющий находитьколлизиина обычном компьютере с любым начальным вектором (A,B,C,D) при помощи метода, названного им «туннелирование»^[7]^[20].

Алгоритм MD5 использует итерационныйметод Меркла — Дамгора,поэтому становится возможным построение коллизий с одинаковым, заранее выбранным префиксом. Аналогично, коллизии получаются при добавлении одинакового суффикса к двум различным префиксам, имеющим одинаковый хеш. В 2009 году было показано, что для любых двух заранее выбранных префиксов можно найти специальные суффиксы, с которыми сообщения будут иметь одинаковое значение хеша. Сложность такой атаки составляет всего 2³⁹операций подсчёта хеша^[21].

Метод Ван Сяоюня и Юй Хунбо

МетодВан Сяоюня^[англ.]иЮй Хунбоиспользует тот факт, что MD5 построен на итерационном методе Меркла — Дамгора. Поданный на вход файл сначала дополняется, так чтобы его длина была кратна 64 байтам, после этого он делится на блоки по 64 байта каждый $M_{0}$ , $M_{1}$ , $\dots {}$ , $M_{n-1}$ .Далее вычисляется последовательность 16-байтных состояний $s_{0}$ , $\dots {}$ , $s_{n}$ по правилу $s_{i+1}=f\left(s_{i},M_{i}\right)$ ,где $f$ — некоторая фиксированная функция. Начальное состояние $s_{0}$ называетсяинициализирующим вектором.

Метод позволяет для заданного инициализирующего вектора найти две пары $M,M'$ и $N,N'$ ,такие что $f(f(s,M),M')=f(f(s,N),N')$ .Этот метод работает для любого инициализирующего вектора, а не только для вектора используемого по стандарту.

Эта атака является разновидностьюдифференциальнойатаки, которая, в отличие от других атак этого типа, использует целочисленное вычитание, а неXORв качестве меры разности. При поиске коллизий используется метод модификации сообщений: сначала выбирается произвольное сообщение $M_{0}$ ,далее оно модифицируется по некоторым правилам, сформулированным в статье, после чего вычисляется дифференциал хеш-функции, причём $M'_{0}=M_{0}+dM_{0}$ с вероятностью ${2}^{-37}$ .К $M_{0}$ и $M'_{0}$ применяется функция сжатия для проверки условий коллизии; далее выбирается произвольное $M_{1}$ ,модифицируется, вычисляется новый дифференциал, равный нулю с вероятностью ${2}^{-30}$ ,а равенство нулю дифференциала хеш-функции как раз означает наличие коллизии. Оказалось, что найдя одну пару $M_{0}$ и $M'_{0}$ ,можно менять лишь два последних слова в $M_{0}$ ,тогда для нахождения новой пары $M_{1}$ и $M'_{1}$ требуется всего около ${2}^{39}$ операций хеширования^[19].

Применение этой атаки кMD4позволяет найти коллизию меньше чем за секунду. Она также применима к другим хеш-функциям, таким какRIPEMDиHAVAL^[5].

Примеры использования

Ранее считалось, что MD5 позволяет получать относительно надёжный идентификатор для блока данных. На данный момент данная хеш-функция не рекомендуется к использованию, так как существуют способы нахожденияколлизийс приемлемой вычислительной сложностью^[14]^[22].

Свойство уникальности хеша широко применяется в разных областях^[23].Приведенные примеры относятся и к другимкриптографическим хеш-функциям.

С помощью MD5 проверяли целостность и подлинность скачанных файлов — так, некоторые программы поставляются вместе со значениемконтрольной суммы.Например, пакеты для инсталляции свободного ПО^[24].

MD5 использовался для хеширования паролей. В системеUNIXкаждый пользователь имеет свой пароль и его знает только пользователь. Для защиты паролей используется хеширование. Предполагалось, что получить настоящий пароль можно только полным перебором. При появленииUNIXединственным способом хеширования былDES(Data Encryption Standard), но им могли пользоваться только жителиСША,потому что исходные кодыDESнельзя было вывозить из страны. ВоFreeBSDрешили эту проблему. ПользователиСШАмогли использовать библиотекуDES,а остальные пользователи имеют метод, разрешённый для экспорта. Поэтому вFreeBSDстали использовать MD5 по умолчанию.^[25].НекоторыеLinux-системы также используют MD5 для хранения паролей^[26].

Многие системы используют базы данных для аутентификации пользователей и существует несколько способов хранения паролей^[27]:

Пароли хранятся как есть. При взломе такой базы все пароли станут известны.
Хранятся только хеши паролей. Найти пароли можно, используя заранее подготовленные таблицы хешей. Такие таблицы составляются из хешей простых или популярных паролей.
К каждому паролю добавляется несколько случайных символов (их называют «соль») и результат хешируется. Полученный хеш вместе с «солью» сохраняются в открытом виде. Найти пароль с помощью таблиц таким методом не получится.

Существует несколько надстроек над MD5.

MD5 (HMAC) — Keyed-Hashing for Message Authentication (хеширование с ключом для аутентификации сообщения) — алгоритм позволяет хешировать входное сообщение L с некоторым ключом K, такое хеширование позволяет аутентифицировать подпись^[28].
MD5 (Base64) — здесь полученный MD5-хеш кодируется алгоритмом Base64.
MD5 (Unix) — алгоритм вызывает тысячу раз стандартный MD5 для усложнения процесса. Также известен как MD5crypt^[29].

Примечания

↑What are MD2, MD4, and MD5?(англ.).RSA Laboratories (2000). Дата обращения: 11 июля 2009. Архивировано изоригинала23 августа 2011 года.
↑¹ ² ³ ⁴Rivest, 1992.
↑Boer, Bosselaers, 1993.
↑¹ ²Hans Dobbertin.The Status of MD5 After a Recent Attack(неопр.).Дата обращения: 22 октября 2015.
↑¹ ² ³Xiaoyun Wang, Dengguo Feng, Xuejia Lai, Hongbo Yu.Collisions for Hash Functions MD4, MD5, HAVAL-128 and RIPEMD(англ.)(17 августа 2004). Дата обращения: 19 ноября 2008. Архивировано изоригинала23 августа 2011 года.
↑Arjen Lenstra, Xiaoyun Wang and Benne de Weger.Colliding X.509 Certificates(неопр.).eprint.iacr.org(1 марта 2005). Дата обращения: 4 декабря 2015.Архивировано4 марта 2016 года.
↑¹ ²Vlastimil Kli'ma.Tunnels in Hash Functions: MD5 Collisions Within a Minute(англ.)(17 апреля 2006). Дата обращения: 19 ноября 2008. Архивировано изоригинала23 августа 2011 года.
↑CERT Vulnerability Note VU#836068(англ.).kb.cert.org (30 декабря 2008). Дата обращения: 10 октября 2015.Архивировано26 июля 2011 года.
↑Tao Xie, Dengguo Feng.Construct MD5 Collisions Using Just A Single Block Of Message(неопр.)(PDF) (16 декабря 2010). Дата обращения: 16 октября 2015.Архивировано14 мая 2017 года.
↑Marc Stevens – Research – Single-block collision attack on MD5(неопр.).Marc-stevens.nl (2012). Дата обращения: 16 октября 2015.Архивировано15 мая 2017 года.
↑Иными словами, в таблице представлены по 32 бита после десятичной запятой от значений функцииsin,где аргумент n в радианах.
↑Detection Of Phishing Websites And Secure Transactions(неопр.).Anna University (2012). Дата обращения: 20 октября 2015. Архивировано изоригинала4 марта 2016 года.
↑Ah Kioon, Wang, Deb Das, 2013.
↑¹ ² ³Updated Security Considerations for the MD5 Message-Digest and the HMAC-MD5 Algorithms(неопр.).Internet Engineering Task Force (март 2011). Дата обращения: 23 октября 2015.Архивировано15 июня 2017 года.
↑PasswordsPro(неопр.).InsidePro Software. — Программа для восстановления паролей к хешам различных типов. Дата обращения: 19 ноября 2008. Архивировано изоригинала27 августа 2011 года.
↑Проект MD5на сайтеSourceForge.net
↑CERIAS — Security Archive(неопр.).Center for Education and Research in Information Assurance and Security (июнь 2000). Дата обращения: 19 ноября 2008.Архивировано7 декабря 2008 года.
↑Philip Hawkes, Michael Paddon, Gregory G. Rose.Musings on the Wang et al. MD5 Collision(англ.)(13 октября 2004). Дата обращения: 19 ноября 2008. Архивировано изоригинала23 августа 2011 года.
↑¹ ²Wang, Yu, 2005.
↑Vlastimil Klima.MD5 collisions(англ.).Дата обращения: 19 ноября 2008. Архивировано изоригинала23 августа 2011 года.
↑Stevens, Lenstra, Weger, 2012.
↑Marc Stevens, Arjen Lenstra and Benne de Weger.Vulnerability of software integrity and code signing applications to chosen-prefix collisions for MD5(неопр.)(30 ноября 2007). Дата обращения: 25 октября 2015.Архивировано13 декабря 2007 года.
↑Ilya Mironov.Hash functions: Theory, attacks, and applications(неопр.).Microsoft Research(14 ноября 2005). Дата обращения: 13 ноября 2015.Архивировано4 марта 2016 года.
↑Turnbull J.Hardening Linux(англ.)— 1 —Apress,2005. — P. 57—58.
↑Bill Swingle.Руководство FreeBSD (DES, MD5 и шифрование)(неопр.)(2006). Дата обращения: 20 ноября 2008. Архивировано изоригинала17 сентября 2009 года.
↑Vicki Stanfield, Roderick W. Smith.Linux System Administration (Craig Hunt Linux Library). — 2. — Sybex, 2002. — С. 479—483. — 656 с. —ISBN 978-0782141382.
↑Hossein Bidgoli.The Internet Encyclopedia, Volume 3. — 1. — Wiley, 2003. — С. 3—4. — 908 с. —ISBN 978-0471222019.
↑Krawczyk, Hugo, Canetti, Ran, Bellare, Mihir.HMAC: Keyed-Hashing for Message Authentication(неопр.).tools.ietf.org. Дата обращения: 5 декабря 2015.Архивировано15 апреля 2021 года.
↑Steven Alexander.password protection for modern operating systems(неопр.).USENIX 2004(июнь 2004). Дата обращения: 5 декабря 2015.Архивировано8 декабря 2015 года.

Литература

Rivest R.The MD5 Message-Digest Algorithm(англ.)—IETF,1992. — 21 p. —doi:10.17487/RFC1321
Boer B. d.,Bosselaers A.Collisions for the compression function of MD5(англ.)//Advances in Cryptology — EUROCRYPT ’93:Workshop on the Theory and Application of Cryptographic Techniques Lofthus, Norway, May 23–27, 1993 Proceedings/T. Helleseth— 1 — Berlin:Springer Berlin Heidelberg,1993. — P. 293—304. — 465 p. —ISBN 978-3-540-57600-6—doi:10.1007/3-540-48285-7_26
Xiaoyun W.,Yu H.How to Break MD5 and Other Hash Functions(англ.)//Advances in Cryptology — EUROCRYPT 2005:24th Annual International Conference on the Theory and Applications of Cryptographic Techniques, Aarhus, Denmark, May 22-26, 2005. Proceedings/R. Cramer—Springer Science+Business Media,2005. — P. 19—35. — 578 p. —ISBN 978-3-540-25910-7—doi:10.1007/11426639_2
Stevens M.,Lenstra A. K.,Weger B. d.Chosen-prefix collisions for MD5 and applications(англ.)//International Journal of Applied Cryptography—Inderscience Publishers,2012. — Vol. 2, Iss. 4. — P. 322—359. — ISSN1753-0563;1753-0571—doi:10.1504/IJACT.2012.048084
Ah Kioon, Mary Cindy,Wang Z.,Deb Das S.Security Analysis of MD5 Algorithm in Password Storage(англ.)//Applied Mechanics and Materials— 2013. — Vol. 2706-2711. — ISSN1660-9336;1662-7482;2297-8941—doi:10.4028/WWW.SCIENTIFIC.NET/AMM.347-350.2706

Ссылки

Генератор MD5 хеша из обычного текста
База данных простых MD5 хешей(позволяет произвести обратный декодирование простых MD5 хешей, используя базу данных сгенерированных хешей)
Одноимённый образовательный центр в городе Алматы.Наименование образовательного центра является отсылкой на материал, который используется в нескольких лекциях понаправлению WEB разработки

[rsa_faq-1] What are MD2, MD4, and MD5?(англ.).RSA Laboratories (2000). Дата обращения: 11 июля 2009. Архивировано изоригинала23 августа 2011 года.

[_be151b4810cd8fe5-2] ¹ ² ³ ⁴Rivest, 1992.

[_c57215a3660f021a-3] Boer, Bosselaers, 1993.

[:2-4] ¹ ²Hans Dobbertin.The Status of MD5 After a Recent Attack(неопр.).Дата обращения: 22 октября 2015.

[:0-5] ¹ ² ³Xiaoyun Wang, Dengguo Feng, Xuejia Lai, Hongbo Yu.Collisions for Hash Functions MD4, MD5, HAVAL-128 and RIPEMD(англ.)(17 августа 2004). Дата обращения: 19 ноября 2008. Архивировано изоригинала23 августа 2011 года.

[6] Arjen Lenstra, Xiaoyun Wang and Benne de Weger.Colliding X.509 Certificates(неопр.).eprint.iacr.org(1 марта 2005). Дата обращения: 4 декабря 2015.Архивировано4 марта 2016 года.

[:3-7] ¹ ²Vlastimil Kli'ma.Tunnels in Hash Functions: MD5 Collisions Within a Minute(англ.)(17 апреля 2006). Дата обращения: 19 ноября 2008. Архивировано изоригинала23 августа 2011 года.

[USCERT-8] CERT Vulnerability Note VU#836068(англ.).kb.cert.org (30 декабря 2008). Дата обращения: 10 октября 2015.Архивировано26 июля 2011 года.

[9] Tao Xie, Dengguo Feng.Construct MD5 Collisions Using Just A Single Block Of Message(неопр.)(PDF) (16 декабря 2010). Дата обращения: 16 октября 2015.Архивировано14 мая 2017 года.

[10] Marc Stevens – Research – Single-block collision attack on MD5(неопр.).Marc-stevens.nl (2012). Дата обращения: 16 октября 2015.Архивировано15 мая 2017 года.

[11] Иными словами, в таблице представлены по 32 бита после десятичной запятой от значений функцииsin,где аргумент n в радианах.

[12] Detection Of Phishing Websites And Secure Transactions(неопр.).Anna University (2012). Дата обращения: 20 октября 2015. Архивировано изоригинала4 марта 2016 года.

[_4e15c78123853cf0-13] Ah Kioon, Wang, Deb Das, 2013.

[RFC6151-14] ¹ ² ³Updated Security Considerations for the MD5 Message-Digest and the HMAC-MD5 Algorithms(неопр.).Internet Engineering Task Force (март 2011). Дата обращения: 23 октября 2015.Архивировано15 июня 2017 года.

[15] PasswordsPro(неопр.).InsidePro Software. — Программа для восстановления паролей к хешам различных типов. Дата обращения: 19 ноября 2008. Архивировано изоригинала27 августа 2011 года.

[16] Проект MD5на сайтеSourceForge.net

[17] CERIAS — Security Archive(неопр.).Center for Education and Research in Information Assurance and Security (июнь 2000). Дата обращения: 19 ноября 2008.Архивировано7 декабря 2008 года.

[18] Philip Hawkes, Michael Paddon, Gregory G. Rose.Musings on the Wang et al. MD5 Collision(англ.)(13 октября 2004). Дата обращения: 19 ноября 2008. Архивировано изоригинала23 августа 2011 года.

[_36649182e1c2fe0b-19] ¹ ²Wang, Yu, 2005.

[20] Vlastimil Klima.MD5 collisions(англ.).Дата обращения: 19 ноября 2008. Архивировано изоригинала23 августа 2011 года.

[_6032f59b7ffe46b5-21] Stevens, Lenstra, Weger, 2012.

[22] Marc Stevens, Arjen Lenstra and Benne de Weger.Vulnerability of software integrity and code signing applications to chosen-prefix collisions for MD5(неопр.)(30 ноября 2007). Дата обращения: 25 октября 2015.Архивировано13 декабря 2007 года.

[23] Ilya Mironov.Hash functions: Theory, attacks, and applications(неопр.).Microsoft Research(14 ноября 2005). Дата обращения: 13 ноября 2015.Архивировано4 марта 2016 года.

[_b0e1fd0b36499a1a-24] Turnbull J.Hardening Linux(англ.)— 1 —Apress,2005. — P. 57—58.

[25] Bill Swingle.Руководство FreeBSD (DES, MD5 и шифрование)(неопр.)(2006). Дата обращения: 20 ноября 2008. Архивировано изоригинала17 сентября 2009 года.

[26] Vicki Stanfield, Roderick W. Smith.Linux System Administration (Craig Hunt Linux Library). — 2. — Sybex, 2002. — С. 479—483. — 656 с. —ISBN 978-0782141382.

[27] Hossein Bidgoli.The Internet Encyclopedia, Volume 3. — 1. — Wiley, 2003. — С. 3—4. — 908 с. —ISBN 978-0471222019.

[28] Krawczyk, Hugo, Canetti, Ran, Bellare, Mihir.HMAC: Keyed-Hashing for Message Authentication(неопр.).tools.ietf.org. Дата обращения: 5 декабря 2015.Архивировано15 апреля 2021 года.

[29] Steven Alexander.password protection for modern operating systems(неопр.).USENIX 2004(июнь 2004). Дата обращения: 5 декабря 2015.Архивировано8 декабря 2015 года.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

Хеш-функции
Общего назначения	Adler-32 CRC Контрольная сумма Флетчера FNV MurmurHash2 MurmurHash2A MurmurHash3 PJW-32 TTH-Дерево хешей Jenkins hash Хеш-сумма
Криптографические	ГОСТ Р 34.11-94 Стрибог BelT BLAKE Blue Midnight Wish CubeHash ECHO Edonkey2k FSB Fugue Grøstl HAVAL Hamsi JH Kupyna LM-хеш Luffa MASH-1 MD2 MD4 MD5 MD6 N-Hash RIPEMD-128 RIPEMD-160 RIPEMD-256 RIPEMD-320 SHA-1 SHA-2 SHA-3(Keccak) SHABAL SHAvite-3 SIMD SWIFFT Skein Snefru Tiger Whirlpool
Функции формирования ключа	bcrypt PBKDF2 scrypt Argon2 Lyra2
Контрольное число(сравнение)	Контрольная сумма Алгоритм Верхуффа Алгоритм Дамма Алгоритм Луна Штрих-код Банковских счетов Банковских карт ISIN СНИЛС ОКПО ИНН ОКАТО ISBN ОГРН и ОГРНИП VIN
Применение хешей	Сравнение контрольных чисел Коллизия хеш-функции Протоколы аутентификации Сравнение штрихкодов Криптография Magnet-ссылка Подпись Меркла ed2k URN

MD5

Содержание