Історія кодування інформації

Автор работы: Пользователь скрыл имя, 11 Апреля 2013 в 17:27, реферат

Краткое описание

Виконання функцій кодування і декодування обчислювальними або керуючими процесорами відкриває нові можливості аналізу даних, їх перетворення, формування перешкодозахищеність кодових послідовностей і накладає нові вимоги на вибір методів завадостійкого кодування. Необхідні коди, ефективні і в каналі зв'язку при апаратній реалізації, і в ЕОМ при програмної реалізації. Введену надмірність використовують для підвищення достовірності при передачі по каналу зв'язку і при обробці даних в ЕОМ. При цьому код повинен бути простим у використанні його людиною.
При передачі інформації відбувається кодування інформації, і ми повинні домовитися про те, як розуміти ті чи інші позначення.

Содержание

Вступ
Рання історія кодування символів
Поняття про кодування
Кодування текстової інформації
Кодування графічної інформації
4.1. Растрове зображення
4.2. Векторне і фрактальної зображення.
Кодування звукової інформації
Висновок
Список літератури

Прикрепленные файлы: 1 файл

реферат.docx

— 43.46 Кб (Скачать документ)

ВИЩИЙ ДЕРЖАВНИЙ НАВЧАЛЬНИЙ ЗАКЛАД

«ЗАПОРІЗЬКИЙ  НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ»

Міністерство освіти і науки, молоді та спорту України

Кафедра інформаційних технологій

 

 

 

 

 

 

 

 

 

Індивідуальне завдання

з  дисципліни «Нові інформаційні технології»

реферат на тему: «Історія кодування інформації»

 

 

 

 

 

 

 

Виконала: студентка

 групи № 1161-1 

 

 

 

Перевірив:

 

 

 

 

 

 

Запоріжжя

2012

 

 

План

Вступ

  1. Рання історія кодування символів
  2. Поняття про кодування
  3. Кодування текстової інформації
  4. Кодування графічної інформації

4.1. Растрове  зображення

4.2. Векторне і фрактальної зображення.

  1. Кодування звукової інформації

Висновок

Список літератури

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вступ

При передачі інформації відбувається кодування  інформації, і ми повинні домовитися про те, як розуміти ті чи інші позначення.

Людина висловлює свої думки словами. Вони є алфавітним представленням інформації. На уроках фізики при розгляді якогось явища ми використовуємо формули. У цьому випадку говорять про мову алгебри. Формула - це математичний код. Існує мова глухонімих, де символи - міміка та жести; мова музики, де символи - ноти і т.д.

Основу  будь-якої мови складає алфавіт - кінцевий набір різних символів, з яких складається повідомлення.

Одна  і та ж запис може нести різне смислове навантаження. Наприклад, набір цифр 251299 може позначати: масу об'єкта; довжину об'єкта; відстань між об'єктами; номер телефону; дату 25 грудня 1999 року. Ці приклади говорять, що для подання інформації можуть використовуватися різні коди, і тому треба знати закони запису цих кодів, тобто вміти кодувати.  

 

1. Рання  історія кодування символів.

Телеграфія  і початок електронної обробки  даних.

Першим  методом кодування, широко застосовуваним для перетворення символів і текстів  в електронний вигляд, був метод, запропонований Морзе. Те, що цей метод кодування був винайдений для передачі повідомлень по телеграфних лініях, а не для обробки текстів у комп'ютерах, загальновідомо. Однак набагато менша кількість людей знає, що його винахідник, американець Семюел Фінлі Бриз Морзе (1791-1872), був також відомим художником. У свій час він вивчав малювання в Лондоні і там дізнався про дослідження електромагнетизму, проведених британськими вченими. Повертаючись по морю в США в 1832-му році, він задумав створити свою власну систему телеграфу. Саме з цієї системи почався рух у бік того світу електронних мереж, в якому ми зараз живемо, і саме за її розробку Морзе здобув славу "американського Леонардо да Вінчі". Морзе винайшов метод кодування, який він використовував для посилки свого історичного повідомлення, в 1838-му році. Метод кодування Морзе нагадує двійковий код, що використовується в сучасних комп'ютерах, тим, що він теж базувався на двох можливих значеннях - у випадку методу кодування Морзе, це були точка або тире. Однак на відміну від сучасних методів кодування, використовуваних для нумерації символів в сучасних комп'ютерах, комбінації крапок і тире, використовувані для представлення символів в методі кодування Морзе, були різної довжини. Морзе використовував принцип, за яким найбільш часто вживаним буквах ставилися у відповідність найбільш короткі послідовності з крапок і тире, що істотно скорочувало довжину повідомлення. Наприклад, найбільш часто використовуваною в англійській мові букві "E" в методі кодування Морзе відповідає одна точка; другою за частотою використання букві англійської мови - "T" - одне тире. Цікаво, що Морзе підраховував частоту використання букв не шляхом вивчення текстів, а шляхом підрахунку літер кожного типу в друкарському наборі. Результатом його воістину каторжної праці став високоефективний метод кодування, який з деякими змінами використовується до цих пір, хоча з моменту його винаходу пройшло вже більше 160 років.

Наступним істотним проривом вперед в технології телеграфу був примітивний друкує телеграфний апарат, або "телетайп"; його запатентував у Франції в 1874-му році Жан Моріс Еміль Бодо (1845-1903). Як і телеграф Морзе, цей винахід призвело до створення нової системи кодування символів - 5-бітного методу кодування Бодо. Метод кодування Бодо став першим у світі методом кодування текстових даних за допомогою двійкових послідовностей. Повідомлення, для передачі яких використовувалася система кодування Бодо, роздруковувалися операторами на вузькі стрічки для двоканальної зв'язку за допомогою спеціальних 5-клавішних клавіатур. У більш пізніх версіях пристрою використовувалися клавіатури з буквами, які вже автоматично генерували відповідну тієї чи іншої букві 5-бітну послідовність. Іншою особливістю телетайпа Бодо було мультиплексування, що забезпечує можливість одночасної роботи до 6-ти операторів завдяки застосуванню системи часового розподілу. Це дозволило значно збільшити пропускну спроможність телеграфної лінії. Запропонована Бодо апаратура зарекомендувала себе дуже позитивно і залишалася в широкому застосуванні в XX-му столітті, поки її не витіснили телефони та персональні комп'ютери.

1890-й  рік: американське Бюро статистики і поява в ньому нової системи для кодування символів

Кінець XIX-го століття ознаменувався винаходом  ще однієї системи для кодування  символів природних мов. Він була створена в США для обробки  даних, що збираються під час переписів населення, молодим американським  винахідником, якого звали Герман Холлеріт (1860-1929). Після закінчення Нью-Йоркській Колумбійської школи гірничої справи в 1879-му році, в 1880-м Холлеріт влаштувався на роботу в Бюро статистики при Міністерстві внутрішніх справ США. Наслідки цього, здавалося б, незначного події позначалися згодом аж до 1970-х років, "золотої ери" великих обчислювальних машин. Герман Холлеріт був ні ким іншим, як винахідником коду Холлеріта, що використовувався для запису алфавітно-цифрової інформації на паперових перфорованих картах. З появою перфокарт в американських масах виникло жартівливе вираз 'do not fold, spindle, or mutilate' ("не гнути, не зволікати, не м'яти"), яке залишало у багатьох американців враження, що комп'ютери скоро будуть повністю контролювати їх суспільство.

У системі  кодування Холлеріта, на перший погляд, двійкова послідовність, що відповідає одному алфавітно-цифрового символу, реєструвалася в 12-ти горизонтальних рядах перфокарти, і оскільки кожен з рядів міг бути перфоровано або не перфоровано (містити 1 або 0), це давало б 12 -бітний метод кодування. Максимально можлива кількість елементів, яке могло б бути представлено за допомогою такого методу кодування - 212, тобто 4096. Насправді ж таблиця символів, використовувана в системі Холлеріта, містила тільки 69 символів - це були заголовні латинські літери, арабські цифри, розділові знаки і деякі інші символи. Таким чином, реальні можливості системи кодування Холлеріта за поданням текстових даних були порівнянні навіть з такими можливостями системи кодування Бодо. Навіщо ж тоді, запитає читач, на перфокарті було передбачено так багато горизонтальних рядів? Однією з причин цього є той факт, що більша кількість рядів дозволяє кодувати дані, виробляючи меншу кількість перфорацій, а це було критично, так як робота з перфораторами карт протягом багатьох років проводилася уручну. Оскільки рядів було багато, для кодування кожній з 10 арабських цифр (а також 2-х літер латинського алфавіту) було достатньо зробити всього одну перфорацію на один вертикальний ряд. Що залишилися 24 літери латинського алфавіту кодировались за допомогою двох перфорацій. Для кодування знаків пунктуації та інших символів було потрібно зробити 2 або більше перфорацій, тому нерідко вони взагалі не використовувалися.

 

2. Поняття  про кодування

Код - набір умовних позначень для представлення інформації.

Кодування - процес представлення інформації у вигляді коду. Кодування зводиться  до використання сукупності символів за суворо визначеними правилами. При переході вулиці ми зустрічаємося з кодуванням інформації у вигляді сигналів світлофора. Водій передає сигнал за допомогою гудка або миготінням фар. Кодувати інформацію можна усно, письмово, жестами або сигналами будь-який інший природи. У міру розвитку техніки з'явилися різні способи кодування інформації. У другій половині XIX століття американський винахідник Морзе винайшов дивний код, який служить людству дотепер.

В якості джерел інформації може виступати людина, технічний пристрій, предмети, об'єкти живої і неживої природи. Одержувачів  повідомлення може бути декілька або  один.

У процесі  обміну інформацією ми здійснюємо дві  операції: кодування і декодування. При кодуванні відбувається перехід  від вихідної форми подання інформації у форму, зручну для зберігання, передачі або обробки, а при декодуванні - у зворотному напрямку.

Сучасний  комп'ютер може обробляти числову, текстову, графічну, звукову та відео інформацію. Всі ці види інформації в комп'ютері представлені в двійковому коді, тобто використовується алфавіт потужністю два (всього два символи 0 і 1). Пов'язано це з тим, що зручно представляти інформацію у вигляді послідовності електричних імпульсів: імпульс відсутня (0), імпульс є (1). Таке кодування прийнято називати двійковим, а самі логічні послідовності нулів та одиниць - машинною мовою.

 

 

 

 

 

 

 

Вид інформації

двійковий код

числова

 

 

10110011

текстова

графічна

звукова

відео


 

  

Кожна цифра  машинного двійкового коду несе кількість  інформації рівне одному біту.

    Даний  висновок можна зробити, розглядаючи  цифри машинного алфавіту, як  рівноімовірні події. При запису двійкової цифри можна реалізувати вибір тільки одного з двох можливих станів, а, значить, вона несе кількість інформації рівне 1 біт. Отже, дві цифри несуть інформацію 2 біти, чотири розряду - 4 біти і т. д. Щоб визначити кількість інформації в бітах, досить визначити кількість цифр у двійковому машинному коді.

 

3. Кодування  текстової інформації

   В даний час велика частина  користувачів за допомогою комп'ютера  обробляє текстову інформацію, яка  складається з символів: букв, цифр, розділових знаків та ін

   Традиційно для того щоб закодувати  один символ використовують кількість  інформації рівне 1 байту, тобто  I = 1 байт = 8 біт. За допомогою формули,  яка пов'язує між собою кількість  можливих подій і кількість  інформації I, можна обчислити скільки  різних символів можна закодувати (вважаючи, що символи - це можливі  події):

   К = 2I = 28 = 256,

   тобто для представлення текстової  інформації можна використовувати  алфавіт потужністю 256 символів.

   Суть кодування полягає в тому, що кожному символу ставлять  у відповідність двійковий код  від 00000000 до 11111111 або відповідний  йому десятковий код від 0 до 255.

   Необхідно пам'ятати, що в даний  час для кодування російських  букв використовують п'ять різних  кодових таблиць (КОИ - 8, СР1251, ср866, Мас, ISO), причому тексти, закодовані  за допомогою однієї таблиці  не будуть правильно відображатися  в іншому кодуванні. Наочно  це можна представити у вигляді  фрагмента об'єднаної таблиці  кодування символів.

   Одному і тому ж двійковому  коду ставиться у відповідність  різні символи.

Двійковий код Десятковий код КОІ8 СР1251 ср866 Мас ISO

11000010 194 б У - Т

   Втім, у більшості випадків про  перекодуванні текстових документів  піклується на користувач, а спеціальні  програми - конвертори, які вбудовані  в додатки.

   Починаючи з 1997 р. останні версії Microsoft Windows & Office підтримують нову  систему кодування Unicode, яка на  кожен символ відводить по 2 байти,  а, тому, можна закодувати не 256 символів, а 65536 різних символів.

   Щоб визначити числовий код  символу можна або скористатися  кодовою таблицею, або, працюючи  в текстовому редакторі Word 6.0 / 95. Для цього в меню потрібно  вибрати пункт "Вставка" - "Символ", після чого на екрані з'являється  діалогова панель Символ. У діалоговому  вікні з'являється таблиця символів  для вибраного шрифту. Символи  в цій таблиці розташовуються  порядково, послідовно зліва направо,  починаючи з символу Пробіл (лівий  верхній кут) і, закінчуючи, буквою "я" (правий нижній кут).

   Для визначення числового коду  символу в кодуванні Windows (СР1251) потрібно за допомогою миші  або клавіш управління курсором  вибрати потрібний символ, потім  клацнути по кнопці Клавіша.  Після цього на екрані з'являється  діалогова панель Настройка, в  якій в нижньому лівому куті  міститься десятковий числовий  код вибраного символу.

 

4.Кодування  графічної інформації

   У середині 50-х років для великих  ЕОМ, що застосовувались в наукових  і військових дослідженнях, вперше  в графічному вигляді було  реалізовано подання даних. В  даний час широко використовуються  технології обробки графічної  інформації за допомогою ПК.

   Особливо інтенсивно технологія  обробки графічної інформації  за допомогою комп'ютера стала  розвиватися в 80-х роках. Графічну  інформацію можна представляти  в двох формах: аналоговій або  дискретній. Живописне полотно, колір  якого змінюється безперервно  - це приклад аналогового представлення,  а зображення, надруковане за  допомогою струменевого принтера  і складається з окремих точок  різного кольору - це дискретне  уявлення. Шляхом розбиття графічного  зображення (дискретизації) відбувається  перетворення графічної інформації  з аналогової форми в дискретну.  При цьому проводиться кодування  - присвоєння кожному елементу  конкретного значення у формі  коду. При кодуванні зображення  відбувається його просторова  дискретизація. Її можна порівняти  з побудовою зображення з великої  кількості маленьких кольорових  фрагментів (метод мозаїки). Всі зображення  розбивається на окремі крапки, кожному елементу ставиться у  відповідність код його кольору.  При цьому якість кодування  буде залежати від наступних  параметрів: розміру точки і кількості  використовуваних кольорів. Чим  менше розмір точки, а, значить,  зображення складається з більшої  кількості точок, тим вище якість  кодування. Чим більшу кількість  кольорів використовується (тобто  точка зображення може приймати  більше можливих станів), тим більше  інформації несе кожна точка,  а, значить, збільшується якість  кодування. Створення і зберігання  графічних об'єктів можливо в  кількох видах - у вигляді векторного, фрактального або растрового  зображення. Окремим предметом вважається 3D (тривимірна) графіка, в якій поєднуються векторний і растровий способи формування зображень. Вона вивчає методи і прийоми побудови об'ємних моделей об'єктів у віртуальному просторі. Для кожного виду використовується свій спосіб кодування графічної інформації.

 

4.1.Растрове зображення

   За допомогою збільшувального  скла можна побачити, що чорно-біле  графічне зображення, наприклад  з газети, складається з найдрібніших  точок, складових певний візерунок  - растр. У Франції в 19 столітті  виник новий напрям в живописі - пуантилізм. Його техніка полягала  в тому, що на полотно малюнок  наносився пензлем у вигляді  різнокольорових точок. Також  цей метод здавна застосовується  в поліграфії для кодування  графічної інформації. Точність  передачі малюнка залежить від  кількості точок і їх розміру.  Після розбиття малюнка на  точки, починаючи з лівого кута, рухаючись по рядках зліва  направо, можна кодувати колір  кожної точки. Далі одну таку  точку будемо називати пікселем (походження цього слова пов'язано  з англійською абревіатурою "picture element" - елемент малюнка). Обсяг  растрового зображення визначається  множенням кількості пікселів (на  інформаційний об'єм однієї точки,  який залежить від кількості  можливих кольорів). Якість зображення визначається роздільною здатністю монітора. Чим вона вище, тобто більше кількість рядків растра і точок в рядку, тим вища якість зображення. В сучасних ПК в основному використовують наступні дозволяють здібності екрану: 640 на 480, 800 на 600, 1024 на 768 і 1280 на 1024 точки. Так як яскравість кожної крапки і її лінійні координати можна виразити за допомогою цілих чисел, то можна сказати, що цей метод кодування дозволяє використовувати двійковий код для того, щоб обробляти графічні дані.

Информация о работе Історія кодування інформації