Современные способы кодирования информации в вычислительной технике | Статья в сборнике международной научной конференции

Отправьте статью сегодня! Журнал выйдет 4 мая, печатный экземпляр отправим 8 мая.

Опубликовать статью в журнале

Автор:

Рубрика: 4. Информатика

Опубликовано в

XLIII международная научная конференция «Исследования молодых ученых» (Казань, июль 2022)

Дата публикации: 16.07.2022

Статья просмотрена: 784 раза

Библиографическое описание:

Журиха, А. М. Современные способы кодирования информации в вычислительной технике / А. М. Журиха. — Текст : непосредственный // Исследования молодых ученых : материалы XLIII Междунар. науч. конф. (г. Казань, июль 2022 г.). — Казань : Молодой ученый, 2022. — С. 1-6. — URL: https://moluch.ru/conf/stud/archive/457/17390/ (дата обращения: 26.04.2024).



В данной статье отражены понятия: формы передачи информационных данных в вычислительных машинах, раскрыто понятие кодирования информации, рассмотрены способы кодирования текстовой, графической, звуковой информации в вычислительной технике.

Ключевые слова: информация, знак, символ, код, кодирование информации, вычислительная техника.

Мы живем в информационном обществе, информационные системы и технологии проникли во все сферы человеческой деятельности, и их роль продолжает расти: развивается цифровая экономика, цифровое образование, технологии искусственного интеллекта, нейронные сети, которые передают большие массивы информационных данных, поэтому растет и интерес исследователей и практиков к разработке все новых способов кодирования информации, которая применяется вычислительной техникой.

У истоков теории кодирования информационных данных стояли: К. Шеннон, Р. Хэмпинг, В. Кательников и др. Согласно Д. Д. Кловскому информация в компьютерах передается посредством электрических сигналов. А предоставляется в двух формах: сигнал, который непрерывен (аналоговый) или через несколько сигналов (набор напряжений, где каждое напряжение, это цифра величины, которая предоставляется). В первом случае при аналоге, величины, могут быть любого значения в определенных границах. У такой величины может быть множество значений, поэтому первую форму передачи информационных данных еще называют непрерывной. У аналоговой величины нет разрывов, а между значениями величины отсутствуют промежутки. Если создается машина, которая в дальнейшем будет использовать аналог, что бы передавать данные, то у такой машины устройств будет мало (для величины соответствует один или ряд сигналов), но они сложные в техническом отношении (у сигнала много состояний и устройства должны быть способны их различить). Фома, которая не прерывна, применяется в вычислительных машинах, которые аналоговые (АВМ). Данные машины решают дифференциальные уравнения, изучают, как ведут себя объекты, которые подвижны, моделируют процессы и системы решают оптимальные уравнения и проводят параметрическую оптимизацию. АВМ обладают рядом преимуществ: действуют быстро, интегрируют сигнал, способны к функциональному преобразованию, но у данных машин есть и недостатки: они технически сложны, а их эффективность при решении задач по сохранению и обработки больших массивов информации низкая [3, с. 151].

По мнению В. В. Дмитриева, вторая форма, посредством которой информация подается, это дискретная (цифра), при такой форме у величин значений гораздо меньше, значения строго определены, а между значениями величины есть промежутки, то есть значения дискретны, прерывны, следовательно, при второй форме число значений величины конечно, вторую форму, передачи информационных данных применяют ЭВМ, которые цифровые. В этих машинах могут храниться, обрабатываться и передаваться большие объёмы информационных данных. Таким образом, мы выяснили, что электронно-вычислительные машины бывают разных типов по форме передачи информационных данных, следовательно, что бы они эффективно работали с информацией, то ее нужно подвергнуть унификации, то есть кодированию [1, с. 88]. Как подчеркивают В. Д. Колесник, Г. Ш. Полтырев кодирование — это процесс, когда сигнал при передаче приобретает определенную форму, то есть становиться удобным в последующем применении. Другими словами кодирование можно назвать правилом, которое описывает, как должен отображаться одна сумма знаков в другой сумме знаков. Первый набор знаков это алфавит, которые первичный, а отображаемая сумма знаков — кодовый, или алфавит, который нужно кодировать. Кодировать нужно не только единичные символы, но и сочетания символов. Также, что бы построить код, нужно применять, как единичные символы, алфавита, который кодовый, таки и сочетания символов. Сумма алфавита, который кодовый, если она используется, что бы закодировать один символ (или одно сочетание символов) алфавита, который исходный имеет название сочетанием кодов или кодовое сочетание, можно назвать более коротко «код символа». Кодовая комбинация может состоять из одного символа алфавита, который кодовый [4, с. 100].

Символ (сочетание символов) алфавита, который исходный, если он находится в соответствии с кодовой комбинацией имеет название символа, который исходный. Сочетание кодовых комбинаций имеет название кода. Символы (или сочетания символов, при кодировании неединичных символов алфавита, который исходный) алфавита, который исходный должны находиться во взаимосвязи и комбинацией кода и тогда они составят таблицу с кодами.

Кодирование в вычислительной технике имеет свои особенности, составляет как бы свою систему, она имеет собственное название и именуется двоичной, базируется на принципе передачи информации с помощью двух цифр как кодов 1 и 0 (сличение, которое находится в системе, которая двоична). 1 и 0 носят название двоичных цифр или битов (binary digital), можно также назвать бинарным кодом.

Бит это единица подачи информации. Когда число разрядов в кодировании, которое двоично, выросло в один раз, то соответственно вырастет в два сумма значений, выражаемое в системе, которая двоична. Что бы посчитать число значений применяют формулу:

N=2m,

где N — сумма значений, которые независимы и находятся в конкуренции,

m — разрядность кодирования, которое двоично, и существует в этой системе [6, с. 201].

Информационные данные могут быть разных видов: текст, графика, звук, и в каждом виде данных информации применяются свои способы кодирования, рассмотрим данный вопрос подробнее. Чтобы закодировать текст, нужно применить таблицы кодов, принцип данной таблицы — сочетание, сопоставление символа алфавита, буквы, знаков с числом, которое целое, нужно восемь разрядов, которые двоичны, чтобы закодировать 256 разных знаков. Такого объёма достаточно для отображения разными сочетаниями 8 битов все знаки языков, например русский, английский, при том, как в строчном плане, так и в прописном, не только букв, но и знаков препинания: точка, запятая, тире, а также цифр и знаков математики, а также специальных знаков. Таблицы кодов есть почти для всех языков планеты, но они не унифицированы, а унифицированной многоязыковой таблицы до сих пор нет.

Кодирование графики стоит на принципе, что изображение имеет точечную структуру, мелкие точки складываются в рисунок, а он называется растром. У каждой точки изображения есть свои координаты на линейке, каждая точка по-своему яркая, поэтому каждой точке изображения можно присвоить число, которое целое, поэтому для кодирования графики также можно применять код, который двоичен. Если изображение черно-белое, то тогда его можно отобразить как сочетание точек, у точек есть оттенки серого цвета или градации, число оттенков составляет 256. Поэтому чтобы передать, насколько каждая точка изображения яркая, нужно восемь разрядов числа, которое двоично [5, с. 99].

Совсем другим способом кодируется рисунок, если он цветной, здесь, при кодировании применяется декомпозиция. То есть рисунок раскладывается на оттенки цвета, который произвольный, как бы цвет раскладывается на части, из которого цвет состоит. Кодироваться цветные изображения могут разными методами. Общеизвестно, что чтобы получить любой цвет, который видит человеческий глаз, нужно определенным образом смешать разные цвета. Этими цветами обычно выступают три: красный (Red, R), зеленый (Green, G) и синий (Blue, B). Это способ кодирования носит название RGB.

Чтобы закодировать одну точку одного цвета в рисунке, нужно примерно 24 разряда. Такая система может хорошо передать 16,5 млн. разных цветов, это примерно то, что человек может увидеть невооруженным глазом. Эта система передачи графики носит название полноцветной или полный цвет (True Color) [7, с. 95].

Общепринятым выступает тот факт, что есть основные и дополнительные цвета, поэтому при кодировании графики к цвету, который основной, можно присоединить дополнительный, который сделает дополнение цвету, который основной, практические сделает его белым. Цвета, которые дополнительные, это: голубой (Cyan, C), пурпурный (Magenta, M) и желтый (Yellow, Y). Этот способ применяется в полиграфическом производстве, но там используется еще один цвет: черный (Black, K). Этот способ кодирования графики можно назвать CMYK, и что бы этим способом закодировать рисунок, который цветной, нужно не менее 32 разряда, которые двоичны.

Эта система передачи графики носит название полноцветной или полный цвет (True Color). Когда разряды для того, чтобы закодировать цвет, не соответствует числу 32, а меньше, то тогда цветов на изображении будет меньше. Если кодировать цвет в графике при помощи 16-разряда, которые двоичны, то это High Color [2, с. 213].

Методы кодирования звука в вычислительной технике относительно новые и пока не стандартизированы и не унифицированны, в каждой компании свои внутренние стандарты. Но все же можно определить две главные тенденции развития.

Метод FM (Frequency Modulation) — базируется на принципе разложения, рассоединения каждого звука на отдельные сигналы, которые гармоничны и идут друг за другом, причем у этих сигналов разная частота, а видим сигнал как синусоида, которая правильная, поэтому каждому сигналу в звуки можно присвоить код, который двоичен. Обычно звук непрерывен в природе, то есть это аналог. Разлагают звук на части, которые гармоничны и идут друг за другом и отображают части как сигналы в цифре, которые дискретны, специальные приборы — аналогово-цифровые преобразователи (АЦП) [8, с. 250].

При обратном процессе собирание звука из отдельных сигналов, которые гармоничны и идут друг за другом и которые закодированы, то есть им присвоен код в числе, которое целое также выполняют специальные приборы цифро-аналоговые преобразователи (ЦАП). Но этот способ имеет ряд недостатков, основной из них - потеря части данных при кодировании, поэтому и качество звука несколько снижено, звук похож на тот, который выдают электромузыкальные инструменты.

Метод таблично-волнового синтеза (Wave-Table) более прогрессивный, чем описанный выше. В данном методе есть таблицы, которые подготовили заблаговременно, в этих таблицах присутствуют набор звуков, эталоны звуков, которые выдают музыкальные инструменты. Данные эталоны носят название сэмплав. Каждому музыкальному инструменту соответствует свой код в числе, код характеризует, каковы свойства звука: высота, тональность, сила, длительность, динамика. Эталоны представлены реальными звуками, поэтому качество звука при передаче в вычислительной технике хорошее [9, с. 311].

Таким образом, кодирование информации — это определенное изменение информации, которую нужно подготовить к передаче, можно трактовать кодирование и более узко, трансформация из одного состояния в другое, чтобы ее было удобнее хранить, передавать, обрабатывать. Компьютер может воспринимать только ту информацию, которая состоит из чисел, а всю другую: текст, рисунок, звук, нужно закодировать.

Литература:

  1. Дмитриев В. И. Прикладная теория информации: учебное пособие. — М.: Высшая школа, 2019. — 234 с.
  2. Информатика: учебник для вузов / Под общ. ред. А. Н. Данчула. — М.: Изд-во РАГС, 2018. — 528 с.
  3. Кловский Д. Д. Теория передачи сигналов: учебное пособие. -М.: Связь, 2018. — 300 с.
  4. Колесник В. Д., Полтырев Г. Ш. Курс теории информации: учебное пособие. — М.: Наука, 2020. — 289 с.
  5. Кудряшов Б. Д. Теория информации: учебник для вузов. — СПб ПИТЕР, 2018. — 320 с.
  6. Нефедов В. Н., Осипова В. А. Курс дискретной математики: учебное пособие. — М.: МАИ, 2021. — 345 с.
  7. Рябко Б. Я., Фионов А. Н. Эффективный метод адаптивного арифметического кодирования для источников с большими алфавитами // Проблемы передачи информации. — 2019. — Т.35. Вып. — С.95–108.
  8. Семенюк В. В. Экономное кодирование дискретной информации: учебное пособие. — СПб.: СПбГИТМО, 2021. — 400 с.
  9. Соболь Б. В. Информатика: учебник для вузов. — М.: Ростов н/Д: Феникс, 2019. — 448 с.