Задачи на определение информационного объема текста
Теоретический материал:

1) N = 2i, где N – мощность алфавита (количество символов в используемом
алфавите), i – информационный объем одного символа (информационный
вес символа), бит.

2) I = K*i, где I – информационный объем текстового документа (файла), K – количество символов в тексте

При алфавитном подходе к определению количества информации отвлекаются от содержания информации и рассматривают информационное сообщение как последовательность знаков определенной знаковой системы.

Информационная емкость знака.

Представим себе, что необходимо передать информационное сообщение по каналу передачи информации от отправителя к получателю. Пусть сообщение кодируется с помощью знаковой системы, алфавит которой состоит из N знаков {1, ..., N}. В простейшем случае, когда длина кода сообщения составляет один знак, отправитель может послать одно из N возможных сообщений "1", "2", ..., "N", которое будет нести количество информации I (рис. 1).

Формула 1) связывает между собой количество возможных информационных сообщений N и количество информации I, которое несет полученное сообщение. Тогда в рассматриваемой ситуации N — это количество знаков в алфавите знаковой системы, а i - количество информации, которое несет каждый знак:

N = 2i.
_______________________________________________________________________________
С помощью этой формулы можно, например, определить количество информации, которое несет знак в двоичной знаковой системе:

N = 2 => 2 = 2i => 21 = 2i => i = 1 бит.

Таким образом, в двоичной знаковой системе знак несет 1 бит информации. Интересно, что сама единица измерения количества информации "бит" (bit) получила свое название ОТ английского словосочетания "Binary digiT" - "двоичная цифра".

Информационная емкость знака двоичной знаковой системы составляет 1 бит.

Чем большее количество знаков содержит алфавит знаковой системы, тем большее количество информации несет один знак. В качестве примера определим количество информации, которое несет буква русского алфавита.
_______________________________________________________________________________
Пример.
В русский алфавит входят 33 буквы, однако на практике часто для передачи сообщений используются только 32 буквы (исключается буква "ё"). С помощью формулы 1) определим количество информации, которое несет буква русского алфавита:

N = 32 => 32 = 2i => 25 = 2i => i=5 битов.

Таким образом, буква русского алфавита несет 5 битов информации (при алфавитном подходе к измерению количества информации).
_______________________________________________________________________________
Количество информации, которое несет знак, зависит от вероятности его получения. Если получатель заранее точно знает, какой знак придет, то полученное количество информации будет равно 0. Наоборот, чем менее вероятно получение знака, тем больше его информационная емкость.

В русской письменной речи частота использования букв в тексте различна, так в среднем на 1000 знаков осмысленного текста приходится 200 букв "а" и в сто раз меньшее количество буквы "ф" (всего 2). Таким образом, с точки зрения теории информации, информационная емкость знаков русского алфавита различна (у буквы "а" она наименьшая, а у буквы "ф" - наибольшая).

Количество информации в сообщении.

Сообщение состоит из последовательности знаков, каждый из которых несет определенное количество информации. Если знаки несут одинаковое количество информации, то количество информации I в сообщении можно подсчитать, умножив количество информации i, которое несет один знак, на длину кода (количество знаков в сообщении) К:

I = i × K

Так, каждая цифра двоичного компьютерного кода несет информацию в 1 бит. Следовательно, две цифры несут информацию в 2 бита, три цифры - в 3 бита и т. д. Количество информации в битах равно количеству цифр двоичного компьютерного кода (табл. 1.1).
Примеры задач
Задача 1.
Алфавит содержит 32 буквы. Какое количество информации несет одна буква?

Дано:

N = 32 буквы
i - ?
Решение:
N – мощность алфавита. N = 2i => 32 = 2i
Значит вес одного символа i = 5 бит
Ответ: 5 бит

Задача 2
.

В одной из кодировок Unicod каждый символ кодируется 16 битами. определите размер следующего предложения в данной кодировке.
Я к вам пишу - чего же боле? Что я могу ещё сказать?
Считаем количество символов в заданном тексте (перед и после тире – пробел, после знаков препинания, кроме последнего – пробел, пробел – это тоже символ). В результате получаем – 52 символа в тексте.

Дано:
i = 16 бит
K = 52
I - ?
Решение:
I = K*i
I = 52*16 = 832 бит
Ответ: 832 бит

Задача 3.

Статья, набранная на компьютере, содержит 16 страниц, на каждой из странице 35 строк, в каждой строке 64 символа. Определите информационный объём статьи в кодировке Windows-1251, в которой каждый символ кодируется 8 битами.

Дано:

K = 16*35*64 – количество символов в статье
i = 8 бит
I - ?
Решение:
Чтобы перевести ответ в Кбайты нужно разделить результат на 8 и на 1024 (8=23, 1024=210)
I = 16 * 35 * 64 * 8 бит = (213 * 35) / (23 * 210) = 35 Кбайт
Ответ: 35 Кбайт

Задача 4.

Текст рассказа набран на компьютере. информационный объём получившегося файла 15 Кбайт. Текст занимает 10 страниц, на каждой странице одинаковое количество строк, в каждой строке 64 символа. Все символы представлены в кодировке Unicode. В используемой версии Unicode каждый символ кодируется 2 байтами. Определите, сколько строк помещается на каждой странице.

Дано
:
I = 15 Кбайт
K =10*x*64
i = 2 байта
x - ?
Пусть x – это количество строк на каждой странице, тогда K=10*x*64 – количество символов в тексте рассказа.
Решение:
1) Переведем информационный объем текста из Кбайт в байты.
I = 15 Кбайт = 15*1024 байт (не перемножаем)
2) Подставим все данные в формулу для измерения количества информации в тексте.
I = K*i
15*1024 = 10*x*64*2
Выразим из полученного выражения x (количество строк на каждой странице)
x = (15*1024) / (10*64*2) = (15 *210 ) / (5 * 28) = 12
Ответ: 12 страниц
Задачи для самостоятельного решения
Задача 1.
Рассказ, набранный на компьютере, содержит 2 страницы, на каждой странице 32 строки, в каждой строке 64 символа. Определите информационный объём рассказа в одной из кодировок Unicode, в которой каждый символ кодируется 16 битами.
1) 16000 бит
2) 8000 бит
3) 8 Кбайт
4) 4 Кбайт

Задача 2
.
Информационный объём сообщения, содержащего 1024 символа, составляет 1 Кбайт. Каким количеством бит кодируется каждый символ этого сообщения?
1) 32
2) 16
3) 8
4) 4

Задача 3.
Пользователь создал сообщение из 256 символов в кодировке Unicode, в которой каждый символ кодируется 16 битами. После редактирования информационный объём сообщения составил 3072 бит. Определите, сколько символов удалили из сообщения, если его кодировка не изменилась.
1) 100
2) 64
3) 32
4) 16

Задача 4.
В одном из вариантов кодировки Unicode на каждый символ отводится 4 байта. Определите информационный объём из 32 символов в этой кодировке.
1) 64 байта
2) 256 бит
3) 512 бит
4) 1024 бит

Задача 5.
Статья, набранная на компьютере, содержит 48 страниц, на каждой странице 40 строк, в каждой строке 40 символов. Определите размер статьи в кодировке КОИ-8, в которой каждый символ кодируется 8 битами.
1) 1200 байт
2) 150 Кбайт
3) 600 байт
4) 75 Кбайт
This site was made on Tilda — a website builder that helps to create a website without any code
Create a website