Как обозначается алфавит в информатике

Ответ

Проверено экспертом

1.алфавит — это множество символов, используемых при записи текста

2.Полное количество символов в алфавите называется мощностью (размером) алфавита.

3.Информационный объем текста равен произведению количества символов в тексте на вес одного символа I=K*i

запишем условие N=64, K=100, I-?

решение: из формулы мощности алфавита найдем вес одного символа

N=2^i, 64=2^i, 2^6=2^i, i=6 бит

вычислим информационный объем: I=100*6=600 бит

5.байт,килобайт,мегабайт и гигабайт — это единицы измерения информации

запишем условие: N=256, I=3.5 Кб, K=?

решение: вычислим вес одного символа

выразим информационный объем в битах

посчитаем количество символов К=I/i=28672/8=3584 символа

запишем условие: К1=К2, N1=32, N2=64, I1/I2=?

решение: вычислим вес одного символа первого алфавита

вычислим вес одного символа второго алфавита

запишем формулу для нахождения информационного объема первого алфавита I1=K1*i1

запишем формулу для нахождения информационного объема второго алфавита I2=K2*i2

поскольку количество символов в текстах одинаковое, то можно записать отношение

Описание термина

Понятие мощности алфавита находится в основании изучения информатики. Алфавитом принято называть набор многочисленных символов. Сумма всех их в определённом языке и есть алфавитная мощность. Иными словами, это количество всех символов, входящих в конкретно взятый язык. Сюда входят не только буквы, но и прочие обозначения, в частности:

  • числа;
  • спецсимволы;
  • двоеточия;
  • пробел;
  • скобки;
  • запятые;
  • точки;
  • многоточия и прочее.

Это определение считается обобщённым и не принимает во внимание вычисления информационной составляющей сообщения. Она может содержать в себе числа, знаки препинания и прочее. В этом случае прибегают к использованию другого способа. Его суть основывается на том, что любая буква, цифра или знак обладают собственным информационным объемом данных. Компьютер работает с этим информационным кодом и распознает то, что было написано.

Основным постулатом в информатике является тот факт, что устройство разбирает введённую информацию исключительно в двоичном коде в форме нуля и единицы. В итоге получается, что абсолютно любой символ алфавита может быть успешно закодирован при помощи соответствующего подбора этих двух цифровых символов. Самая маленькая последовательность, применяемая при обозначении какой-либо цифры, буквы или другого знака, состоит из двух элементов.

Информационная масса отдельно взятого символа обычно изображается в форме информационной стандартной измерительной единицы, которая называется «бит». Восемь битов становятся равны одному байту.

Отображение символов в двоичном коде

Алфавитная мощность может быть использована на практике только при наличии двоичного кода. В качестве примера можно использовать упрощённый алфавит, состоящий всего из четырёх символов. В этом случае разрядность их и информационное представление описываются следующим образом:

Из этого списка можно сделать вывод о том, что если алфавитная мощность равняется 4, то масса отдельного единичного символа будет составлять 2 бита. Если же есть алфавит, состоящий из 8 символов, то при подборе двоичного трёхзначного кода для него комбинационное количество будет следующим:

Иными словами, если алфавитная мощность равна 8, то вес отдельно взятого символа для двоичного трёхзначного кода составит 3 бита.

Вычисление мощности алфавита

Численность знаков в коде и мощность алфавита всегда выражают определённую зависимость. Для того чтобы определить информационный объём, который заключается в сообщении, прибегают к специальному способу измерения, которое выражается в формуле мощности алфавита: N = 2 в n -ной степени.

Читайте также:  Как вырезать эпизод из видео на ютубе

Эта формула была изобретена американским инженером Ральфом Хартли более сотни лет тому назад. Она применяется для работы с равновероятными событиями и используется для определения мощности конкретного буквенного набора, которая обозначается буквой N (информационная масса или объём). n означает численность бит в словесной единице, иными словами, количество знаков внутри двоичного кода. Так, если n равен 1, то N тоже равен 1, при n = 2 N = 4, при n = 3 N = 8, при n = 4 N = 16.

Чтобы сформулировать теорию о численности информации в набранном словосочетании, пользуются формулой I=K*i. В этом случае К обозначает численность всех символов в предложении, а i — это информационная масса символа.

При ответе на вопрос, как найти мощность алфавита, нужно сказать, что в русском языке 33 буквы, поэтому это можно выразить как N = 33. Для сравнения, аналогичный показатель в английском, немецком и французском языках равняется 26, в испанском — 27. Венгерский язык, например, является 40-символьным.

Существует также и клавиатурный язык, куда входят не только буквы, но и дополнительные знаки. Так, в русском языке есть ещё 10 цифр и 11 символов, а также пробел и пара скобок. Их мощность прибавляется к аналогичному буквенному показателю, и на выходе получается N = 33+10+11+1+2=57. В некоторых случаях букву «ё» не выделяют в качестве отдельного самостоятельного символа, и в таком случае полная мощность русского алфавита становится равна 56.

Определение информационного объёма в тексте

Почти всегда при наборе текста на компьютерах и других электронных устройствах приходится сталкиваться с написанием различных символов. К ним следует отнести:

  • заглавные и жирные буквы;
  • курсив;
  • скобки;
  • знаки препинания;
  • вычислительные операции и прочее.

По всем расчётам получается, что мощность компьютерного алфавита составляет 256 различных символов и вариантов. В соответствии с формулой Хартли, N = 256, а i — масса любого из значков в клавиатурном алфавите соответствует одному байту, или восьми битам.

Размер любой напечатанной фразы может быть вычислен по формуле V=K ⋅ log2N. В этом случае N обозначает количество всех символов в алфавите, а K — это численность знаков непосредственно в напечатанной фразе. Так, например, имеется произвольный текст объёмом в 25 листов. На каждом из них расположено по 45 строчек текста, содержащих по 58 символов.

Исходя из этого, на любой отдельной странице будет 45*58 = 2610 байт информации. В целом же по всему тексту этот объём будет равен 2610*25 = 65250 байт. Для обозначения мощности алфавита в информатике общепринятым вариантом является буква N из формулы Хартли. Именно ее чаще всего указывают в большинстве учебников и профессиональной литературе.

В кодовой таблице ASCII используют восьмибитную кодировку текстовых сообщений. Она позволяет полностью вместить основной набор символов кириллического и латинского алфавитов как в строчном, так и в прописном вариантах. Также с её помощью можно отобразить знаки препинания, цифры и прочие базовые знаки. Часто пользователям приходится иметь дело с более крупными объёмами, состоящими из триллионов байтов.

Для удобства их всегда переводят в увеличенные величины — кило-, мега-, гигабайты и прочее. Для их упрощённого обозначения используются специальные сокращения: Кб, Мб, Гб и так далее. 1 Кб равняется 1024 байтам (2 байта в десятой степени), 1 Мб составляет 1024 Кб (2 Кб в десятой степени) и так далее. Исходя из этого, 65250 байт будут составлять 63,72 килобайта.

Читайте также:  Как поставить цветную печать на принтере

Поскольку один отдельный символ состоит из 8 битов, то устанавливать их кодировку целиком не представляется возможным. Вместо этого предпочтительнее образовать кодировку трёхбитовых комбинаций. Расчёт этого действия проводится по формуле Хартли, где n-ная степень будет равняться трём. В результате получается N, равная 8.

При определении мощности чаще всего используют алфавитный подход. Он говорит о том, что объём информации, заложенной в тексте, зависит исключительно от мощности самого алфавита и размера сообщения (то есть количества символов, содержащихся в нём). Этот показатель не имеет никакой связи со смысловым наполнением для человека.

Примеры расчёта мощности

От пользователей или обучающихся в задачах часто требуют научиться определять информационный объём какого-либо сообщения, приняв информационный вес символа за один байт. Так, в отрывке из поэмы Н. Н. Некрасова «Крестьянские дети»:

Я из лесу вышел; был сильный мороз»

будет 67 символов вместе с пробелами, то есть, в соответствии с условиями задания, 67 байт. Их количество умножают на 8 (количество битов в байте), и на выходе получается 536 битов.

Таким образом, зная в теории суть мощности, можно без проблем определять информационный объем различных сообщений.

Цель урока:

  1. Иметь представление об алфавитном подходе к определению количества информации;
  2. Знать формулу для определения количества информационных сообщений,количества информации в сообщений;
  3. Уметь решать задачи на определение количества информационных сообщений и количества информации, которое несет полученное сообщение.

Ход урока

1. Актуализация знаний:

— Ребята давайте понаблюдаем за тем , что мы видим за окном. Что вы можете сказать о природе? (Наступила зима.)
— Но почему вы решили, что наступила зима? (Холодно , идет снег.)
— Но ведь нигде не написано, что это признаки зимы. (Но мы знаем, что все это означает: наступила зима.)

Поэтому и получается, что , то знание, которое мы извлекаем из окружающей действительности и есть информация. (слайд 1)

Заполнить таблицу и стрелочками показать соответствия.

Носители информации Их использование
Дискета Написать письмо
Бумага Записать компьютерную игру
Аудиокассета Сделать фотоизображение
Фотопленка Записать исполнение песни
Видеокассета Записать ноты песни

— Можно ли измерить количество информации и как это сделать? (Да)

Оказывается, информацию также можно измерять и находить ее количество.

Существуют два подхода к измерению информации. С одним из них мы сегодня познакомимся. (Смотри приложение слайд 2)

2. Изучение нового материала.

Каким образом можно найти количество информации?

У нас есть небольшой текст, написанный на русском языке. Он состоит из букв русского алфавита, цифр, знаков препинания. Для простоты будем считать, что символы в тексте присутствуют с одинаковой вероятностью.

Множество используемых в тексте символов называется алфавитом.

В информатике под алфавитом понимают не только буквы, но и цифры, и знаки препинания, и другие специальные знаки.

Читайте также:  Как поменять пароль на тп линк роутер

У алфавита есть размер (полное количество символов), который называется мощностью алфавита. При алфавитном подходе считается, что каждый символ текста имеет определенный “информационный вес”. С увеличением мощности алфавита увеличивается информационный вес символов этого алфавита.

Обозначим мощность алфавита через N.

Найдем зависимость между информационным весом символа (i) и мощностью алфавита (N). Самый наименьший алфавит содержит 2 символа, которые обозначаются “0” и “1”. Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 бит. (Cмотри приложение слайд 3)

N 2 4 8 16 32 64 128 256
i 1бит 2бит 3бит 4бит 5бит 6бит 7бит 8бит

N= 2 i

В компьютере также используется свой алфавит, который можно назвать компьютерным. Количество символов, которое в него входит, равно 256 символов. Это мощность компьютерного алфавита.

Также мы выяснили, что закодировать 256 разных символов можно показать с помощью 8 битов.

8 бит является настолько характерной величиной, что ей присвоили свое название – байт.

Используя этот факт: можно быстро подсчитать количество информации, содержащееся в компьютерном тексте, т.е.в тексте набранном с помощью компьютера, учитывая, что большинство статей, книг, публикаций и т.д. написаны с помощью текстовых редакторов, то таким способом можно найти информационный объем любого сообщения, созданного подобным образом.

Правило для измерения информации с точки зрения алфавитного подхода посмотрим на слайде. (Cмотри приложение слайд 4)

Пример:

Найти информационный объем страницы компьютерного текста.

1. Найдем мощность: N=256
2. Найдем информационный объем одного символа : N= 2 i i = 8 бит = 1 байт.
3. Найдем количество символов на странице. Примерно.

(Найти количество символов в строке и умножить на количество строк)

Пусть дети выберут произвольную строку и подсчитают количество символов в ней, учитывая все знаки препинания и пробелы.

40 символов * 50 строк = 2000символов.

4. Найдем информационный объем всей страницы: 2000 * 1 = 2000 байтам

Согласитесь, что байт – маленькая единица измерения информации. Для измерения больших объемов информации используют следующие единицы (Cмотри приложение слайд5)

3. Закрепление изученного материала.

Заполнить пропуски числами и проверить правильность.

1 Кбайт = ___ байт = ______бит,
2 Кбайт = _____ байт =______бит,
24576 бит =_____байт =_____Кбайт,
512 Кбайт = ___ байт =_____бит.

Предлагается ученикам задачи:

1) Сообщение записано с помощью алфавита, содержащего 8 символов. Какое количество информации несет одна буква этого алфавита?

Решение: N=8 , то i= 3 битам

2) Сообщение , записанное буквами из 128-символьного алфавита, содержит 30 символов. Какой объем информации оно несет?

1. N= 128 , K=30
2. N= 2 i i= 7 битам (объем одного символа)
3. I = 30*7 = 210бит (объем всего сообщения)

4. Творческая работа.

Наберите на компьютере текст, информационный объем которого равен 240 байт.

5. Итоги урока.

— Что нового сегодня мы узнали на уроке?
— Как определяется количество информации с алфавитной точки зрения?
— Как найти мощность алфавита?
— Чему равен 1байт?

6. Домашнее задание (Cмотри приложение слайд 6).

Выучить правило для измерения информации с точки зрения алфавитного подхода.

Выучить единицы измерения информации.

1) Мощность некоторого алфавита равна 64 символам. Каким будет объем информации в тексте, состоящем из 100символов.
2) Информационный объем сообщения равен 4096 бит. Оно содержит 1024 символа. Какова мощность алфавита, с помощью которого составлено это сообщение?

Adblock
detector