Алгоритм JPEG

Формат файла JPEG (Joint Photographic Experts Group - Объединенная экспертная группа по фотографии, произносится "джейпег) был разработан компанией C-Cube Microsystems как эффективный метод хранения изображений с большой глубиной цвета, например, получаемых при сканировании фотографий с многочисленными едва уловимыми (а иногда и неуловимыми) оттенками цвета. Самое большое отличие формата JPEG от других рассмотренных здесь форматов состоит в том, что в JPEG используется алгоритм сжатия с потерями (а не алгоритм без потерь) информации. Алгоритм сжатия без потерь так сохраняет информацию об изображении, что распакованное изображение в точности соответствует оригиналу. При сжатии с потерями приносится в жертву часть информации об изображении, чтобы достичь большего коэффициента сжатия. Распакованное изображение JPEG редко соответствует оригиналу абсолютно точно, но очень часто эти различия столь незначительны, что их едва можно (если вообще можно) обнаружить.

Процесс сжатия изображения JPEG достаточно сложен и часто для достижения приемлемой производительности требует специальной аппаратуры. Вначале изображение разбивается на квадратные блоки со стороной размером 8 пиксель. Затем производится сжатие каждого блока отдельно за три шага. На первом шаге с помощью формулы дискретного косинусоидального преобразования фуры (DCT) производится преобразование блока 8х8 с информацией о пикселях в матрицу 8x8 амплитудных значений, отражающих различные частоты (скорости изменения цвета) в изображении. На втором шаге значения матрицы амплитуд делятся на значения матрицы квантования, которая смещена так, чтобы отфильтровать амплитуды, незначительно влияющие на общий вид изображения. На третьем и последнем шаге квантованная матрица амплитуд сжимается с использованием алгоритма сжатия без потерь.

Поскольку в квантованной матрице отсутствует значительная доля высокочастотной информации, имеющейся в исходной матрице, первая часто сжимается до половины своего первоначального размера или даже еще больше. Реальные фотографические изображения часто совсем невозможно сжать с помощью методов сжатия без потерь, поэтому 50%-ное сжатие следует признать достаточно хорошим. С другой стороны, применяя методы сжатия без потерь, можно сжимать некоторые изображения на 90%. Такие изображения плохо подходят для сжатия методом JPEG.

При сжатии методом JPEG потери информации происходят на втором шаге процесса. Чем больше значения в матрице квантования, тем больше отбрасывается информации из изображения и тем более плотно сжимается изображение. Компромисс состоит в том, что более высокие значения квантования приводят к худшему качеству изображения. При формировании изображения JPEG пользователь устанавливает показатель качества, величине которого "управляет" значениями матрицы квантования. Оптимальные показатели качества, обеспечивающие лучший баланс между коэффициентом сжатия и качеством изображения, различны для разных изображений и обычно могут быть найдены только методом проб и ошибок.

Данный Алгоритм сжатия используются и предназначен для сжатия картинок то есть растровых изображений(растровое изображение - это когда каждый пиксель на картинки задаётся числом которое представляет собой номер цвета в текущей палитре) растровое изображение хранится в формате BMP. Поэтому любая картинка представляет собой массив пикселей например Эта девушка Лена не что иное как двухмерный массив пикселей В Паскале это выглядит так
Pixels: Array [1..256,1..256] of Byte
Цвет каждого пикселя кодируется Байтом(байт это восемь бит- а бит это либо ноль либо один поэтому один байт это 256 в десятичной системе ).Так есть массив который содержит полную информацию о картинке картинка размером 256*256*256 - третье измерение это цвет. Размер этой картинки, 65536 байт- ровно 64 Кбайта. Много это или мало? Давайте подумаем ...при средней скорости интернета в России 2Kb/sec. Вы смогли бы полюбоваться этой девушкой лишь спустя 32 секунды. Подумайте и о том что интернет в России не бесплатный. Может ли картинка занимать меньше байт -ответ. Да. А теперь я расскажу что я делаю с картинкой что бы она занимала меньше места то есть о том как я их могу сжимать.

В алгоритме JPEG исходное изображение представляется двумерной матрицей размера N*N, элементами которой являются цвет или яркость пикселя. Упаковка значений матрицы выполняется за три этапа, представленных на рисунке 1.

Рис. 1. Этапы работы алгоритма JPEG

Высокая эффективность сжатия, которую дает этот алгоритм, основана на том факте, что в матрице частотных коэффициентов, образующейся из исходной матрицы после дискретного косинусного преобразования, низкочастотные компоненты расположены ближе к левому верхнему углу, а высокочастотные - внизу справа. Это важно потому, что большинство графических образов на экране компьютера состоит из низкочастотной информации, так что высокочастотные компоненты матрицы можно безболезненно выбросить. Выбрасывание выполняется путем округления частотных коэффициентов. После округления отличные от нуля значения низкочастотных компонент остаются, главным образом, в левом верхнем углу матрицы. Округленная матрица значений кодируется с учетом повторов нулей. В результате графический образ сжимается более чем на 90% , теряя очень немного в качестве изображения только на этапе округления.

Дискретное косинус преобразование

Основным этапом работы алгоритма является
дискретное косинусное преобразование (ДКП), представляющее собой разновидность преобразования
Фурье. Оно позволяет переходить от пространственного представления изображения к его 
спектральному представлению и обратно.
Что нужно сделать на первом этапе первом этапе ?
Следует создать ДКП матрицу, используя такую формулу :
        DCT   = 1/sqr(N), если i=0
           ij
        DCT   = sqr(2/N)*cos[(2j+1)*i*3.14/2N], если i > 0
           ij
        N = 8,  0 < i < 7 , 0 < j < 7

в результате имеем:

             |.353553  .353553  .353553  .353553  .353553  .353553  .353553  .353553|
             |.490393  .415818  .277992  .097887 -.097106 -.277329 -.415375 -.490246|
             |.461978  .191618 -.190882 -.461673 -.462282 -.192353  .190145  .461366|
DCT = |.414818 -.097106 -.490246 -.278653  .276667  .490710  .099448 -.414486|
             |.353694 -.353131 -.354256  .352567  .354819 -.352001 -.355378  .351435|
             |.277992 -.490246  .096324  .416700 -.414486 -.100228  .491013 -.274673|
             |.191618 -.462282  .461366 -.189409 -.193822  .463187 -.460440  .187195|
             |.097887 -.278653  .416700 -.490862  .489771 -.413593  .274008 -.092414|

например, нам нужно сжать следующий фрагмент изображения:

            | 95  88  88  87  95  88  95  95|
            |143 144 151 151 153 170 183 181|
            |153 151 162 166 162 151 126 117|
IMG = |143 144 133 130 143 153 159 175|
            |123 112 116 130 143 147 162 189|
            |133 151 162 166 170 188 166 128|
            |160 168 166 159 135 101  93  98|
            |154 155 153 144 126 106 118 133|

            |-33 -40 -40 -41 -33 -40 -33 -33|
            | 15  16  23  23  25  42  55  53|
            | 25  23  34  38  34  23  -2 -11|
IMG = | 15  16   5   2  15  25  31  47|
            | -5 -16 -12   2  15  19  34  61|
            |  5  23  34  38  42  60  38   0|
            | 32  40  38  31   7 -27 -35 -30|
            | 26  27  25  16  -2 -22 -10   5|
                                                             T
вот формула, по которой производится ДКП: RES*IMG*DCT
для начала нужно посчитать промежуточную матрицу: TMP = IMG*DCT
            |-103   -3    1    2    4    0   -1    5|
            |  89  -40   12   -2   -7    5    1    0|
            |  57   31  -30    6    2    0    5    0|
TMP = |  55  -28   24    1    0   -8    0    0|
            |  32  -60   18   -1   14    0   -8    1|
            |  84  -11  -37   17  -24    4    0   -4|
            |  19   81  -16  -20    8   -3    4    0|
            |  22   40   11  -22    8    0   -3    2|

затем умножаем ее на ДКП матрицу: RES = TMP*DCT

            | 91   3  -5  -6   2   0   1|
            |-38 -57   9  17  -2   2   2|
            |-80  58   0 -18   4   3   4|
RES = |-52 -36 -11  13  -9   3   0|
            |-86 -40  44  -7  17  -6   4|
            |-62  64 -13  -1   3  -8   0|
            |-16  14 -35  17 -11   2  -1|
            |-53  32  -9  -8  22   0   2|

Этап Квантования

На этом этапе мы посчитаем матрицу квантования, 
используя этот псевдокод:

for i:=0 to 8 do
 for j:=0 to 8 do
  Q[i,j] = 1+((1+i+j)*q);

где q - это коэффициент качества, от него зависит степень потери качества сжатого изображения
для q = 2 имеем матрицу квантования:

         | 3  5  7  9 11 13 15 17|
         | 5  7  9 11 13 15 17 19|
         | 7  9 11 13 15 17 19 21|
Q =  | 9 11 13 15 17 19 21 23|
         |11 13 15 17 19 21 23 25|
         |13 15 17 19 21 23 25 27|
         |15 17 19 21 23 25 27 29|
         |17 19 21 23 25 27 29 31|

теперь нужно каждое число в матрице квантования разделить на число в соответствующей позиции в 
матрице RES, в результате получим:
         | 30   0   0   0   0   0   0   0|
         | -7   8   1   1   0   0   0   0|
         |-11   6   0   1   0   0   0   0|
A =  | -5  -3   0   0   0   0   0   0|
         | -7  -3   2   0   0   0   0   0|
         | -4   4   0   0   0   0   0   0|
         | -1   0   1   0   0   0   0   0|
         | -3   1   0   0   0   0   0   0|

как вы видите, здесь имеется довольно много нулей, мы получим наиболее длинную последовательность 
нулей, если будем использовать следующий алгоритм:

     +----+----+----+----+----+----+----+----+
     |  1 |  2 |  6 |  7 | 15 | 16 | 28 | 29 |
     +----+----+----+----+----+----+----+----+
     |  3 |  5 |  8 | 14 | 17 | 27 | 30 | 43 |
     +----+----+----+----+----+----+----+----+
     |  4 |  9 | 13 | 18 | 26 | 31 | 42 | 44 |
     +----+----+----+----+----+----+----+----+
     | 10 | 12 | 19 | 25 | 32 | 41 | 45 | 54 |
     +----+----+----+----+----+----+----+----+
     | 11 | 20 | 24 | 33 | 40 | 46 | 53 | 55 |
     +----+----+----+----+----+----+----+----+
     | 21 | 23 | 34 | 39 | 47 | 52 | 56 | 61 |
     +----+----+----+----+----+----+----+----+
     | 22 | 35 | 38 | 48 | 51 | 57 | 60 | 62 |
     +----+----+----+----+----+----+----+----+
     | 36 | 37 | 49 | 50 | 58 | 59 | 63 | 64 |
     +----+----+----+----+----+----+----+----+

итак, у нас получилась последовательность:
30 0 -7 -11 8 0 0 1 6 -5 -7 -3 0 1 0 0 0 1 0 -3 -4 -1 4 2 0 0 0 0
0 0 0 0 0 0 0 -3 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Этап Вторичного Сжатия

 Самым распространенным методом вторичного 
сжатия является метод Хаффмана и его разновидности.

Сжатие Хаффмана - статистический метод сжатия, который уменьшает среднюю длину кодового слова 
для символов алфавита.
Код Хаффмана является примером кода, оптимального в случае, когда все вероятности появления 
символов в сообщении - целые отрицательные степени двойки. Код Хаффмана может быть построен 
по следующему алгоритму:

1.Выписываем в ряд все символы алфавита в порядке возрастания или убывания вероятности их 
появления в тексте;

2.Последовательно объединяем два символа с наименьшими вероятностями появления в новый составной 
символ, вероятность появления которого полагается равной сумме вероятностей составляющих его 
символов. В конце концов, мы построим дерево, каждый узел которого имеет суммарную вероятность 
всех узлов, находящихся ниже него;

3.Прослеживаем путь к каждому листу дерева, помечая направление к каждому узлу (например, направо 
- 1, налево - 0). 

Поясним создание дерева с использованием иллюстраций:

A       B       C       D       E
10      5       8       13      10

B       C       A       E       D
5       8       10      10      13

A       E       BC      D
10      10      13      13

BC      D       AE
13      13      20

AE      BCD
20      26

AEBCD
46

Таким образом, построено дерево

Теперь, если в тексте встречается, например, символ "d" , то вместо того, чтобы выделять этому символу байт, после сжатия символ займет всего 2 бита (01).