Обработка информации

20.03.2022 0 Автор : Марина Николаевна
Обработка информации

По определению, обработка информации – это целенаправленный процесс изменения формы или содержания представленной информации.

Совокупностью последовательных действий, проводимых над информацией для получения какого-либо результата называется информационным процессом.

Классификация основных типов информационных процессов:

  •  обработка;
  • хранение;
  • передача информации.

Типы обработки информации:

  •  обработка, связанная с изменением формы представления информации, не изменяющая ее содержания (кодирование, структурирование, поиск и отбор информации);
  • обработка, связанная с получением нового содержания, новой информации (преобразование по правилам, логические рассуждения, обобщения, исследование объектов познания по их моделям).

Рассмотрим схему процесса обработки информации на рисунке 1.

Рисунок 1 — Общая схема процесса обработки информации

Рассмотрим более подробно отдельные процессы обработки информации.

Кодирование информации

В технических средствах работы с информацией широко используют кодирование информации.

Код —  это система условий обозначений (кодовых слов), которая используется для представления информации.

По определению, кодированием называют обработку информации, которое заключается в переработке информации в иную форму, удобную для хранения, передачи, а также обработки информации в дальнейшем.

Система условных обозначений (кодовых слов), которая используется для представления информации является кодом.

Соответственно, кодовой таблицей является совокупность используемых кодовых слов и их значения.

Азбука Морзе – самый известный код, в котором все буквы и цифры представлены в виде тире и точек. Тире – длинный сигнал, точка – короткий сигнал. Данный код назван был в честь Самюэля Морзе – американского художника и изобретателя. Особенностью кода является то, что буквы, которые встречаются чаще в стандартных сообщениях имеют код более короткий, а вот буквы, реже встречающиеся в сообщениях имеют короткий код.

При этом паузы между сигналами являются разделителями между буквами. Единицей измерения в азбуке Морзе является длительность сигнала «точка», а вот длительность «тире» будет равна длительности трем «точек».

Можно сказать, что пауза является третьим знаком в азбуке Морзе, так как пользователь должен различать длительность пауз внутри слова, между словами и даже паузы между сигналами одного знака. Соответственно, пауза между сигналами одного знака равна одной точке, трем точкам соответствует пауза между знаками в одном слове. Между словами устанавливается пауза равная семи точкам.

Равномерными называют коды, которые в кодовых комбинациях (словах) содержат равное количество символов. Неравномерный код содержит в кодовых комбинациях различное количество символов.

Примером неравномерного кода является азбука Морзе, которая размещена ниже.

азбука Морзе

Основным условием использования неравномерного кода является возможность декодирования, закодированного ранее сообщения.

В технических системах получили распространение префиксные коды или коды со словами переменной длины, обладающий тем свойством, что никакое его кодовое слово не может быть началом другого (более длинного) кодового слова.

Для того, чтобы однозначно декодировать слово, достаточно выполнение одного из условий Фано  — прямого или обратного.

Префиксный код – код со словом переменной длины, обладающий тем свойством, что никакое его кодовое слово не может быть началом (более длинного) кодового слова.

В случае, если для некоторой последовательности кодов выполняется прямое условие Фано, то её декодирование следует вести слева направо. Если для некоторой последовательности кодов выполняется обратное условие Фано, то ее декодирование следует вести справа на лево.

Префиксные коды представляют в виде кодовых деревьев.

Поиск информации

Задача поиска информации: поиск в некотором хранилище информации (информационном массиве) информации, которая удовлетворяет некоторым условиям поиска.

Время поиска будет зависеть от используемого алгоритма поиска и набора данных для поиска.

Метод последовательного перебора применяется при поиске информации в неструктурированных данных.

Метод половинного деления используется при поиске информации в упорядоченном по неубыванию наборе данных.