Как обозначается алфавит в информатике
Содержание
Ответ
Проверено экспертом
1.алфавит — это множество символов, используемых при записи текста
2.Полное количество символов в алфавите называется мощностью (размером) алфавита.
3.Информационный объем текста равен произведению количества символов в тексте на вес одного символа I=K*i
запишем условие N=64, K=100, I-?
решение: из формулы мощности алфавита найдем вес одного символа
N=2^i, 64=2^i, 2^6=2^i, i=6 бит
вычислим информационный объем: I=100*6=600 бит
5.байт,килобайт,мегабайт и гигабайт — это единицы измерения информации
запишем условие: N=256, I=3.5 Кб, K=?
решение: вычислим вес одного символа
выразим информационный объем в битах
посчитаем количество символов К=I/i=28672/8=3584 символа
запишем условие: К1=К2, N1=32, N2=64, I1/I2=?
решение: вычислим вес одного символа первого алфавита
вычислим вес одного символа второго алфавита
запишем формулу для нахождения информационного объема первого алфавита I1=K1*i1
запишем формулу для нахождения информационного объема второго алфавита I2=K2*i2
поскольку количество символов в текстах одинаковое, то можно записать отношение
Описание термина
Понятие мощности алфавита находится в основании изучения информатики. Алфавитом принято называть набор многочисленных символов. Сумма всех их в определённом языке и есть алфавитная мощность. Иными словами, это количество всех символов, входящих в конкретно взятый язык. Сюда входят не только буквы, но и прочие обозначения, в частности:
- числа;
- спецсимволы;
- двоеточия;
- пробел;
- скобки;
- запятые;
- точки;
- многоточия и прочее.
Это определение считается обобщённым и не принимает во внимание вычисления информационной составляющей сообщения. Она может содержать в себе числа, знаки препинания и прочее. В этом случае прибегают к использованию другого способа. Его суть основывается на том, что любая буква, цифра или знак обладают собственным информационным объемом данных. Компьютер работает с этим информационным кодом и распознает то, что было написано.
Основным постулатом в информатике является тот факт, что устройство разбирает введённую информацию исключительно в двоичном коде в форме нуля и единицы. В итоге получается, что абсолютно любой символ алфавита может быть успешно закодирован при помощи соответствующего подбора этих двух цифровых символов. Самая маленькая последовательность, применяемая при обозначении какой-либо цифры, буквы или другого знака, состоит из двух элементов.
Информационная масса отдельно взятого символа обычно изображается в форме информационной стандартной измерительной единицы, которая называется «бит». Восемь битов становятся равны одному байту.
Отображение символов в двоичном коде
Алфавитная мощность может быть использована на практике только при наличии двоичного кода. В качестве примера можно использовать упрощённый алфавит, состоящий всего из четырёх символов. В этом случае разрядность их и информационное представление описываются следующим образом:
Из этого списка можно сделать вывод о том, что если алфавитная мощность равняется 4, то масса отдельного единичного символа будет составлять 2 бита. Если же есть алфавит, состоящий из 8 символов, то при подборе двоичного трёхзначного кода для него комбинационное количество будет следующим:
Иными словами, если алфавитная мощность равна 8, то вес отдельно взятого символа для двоичного трёхзначного кода составит 3 бита.
Вычисление мощности алфавита
Численность знаков в коде и мощность алфавита всегда выражают определённую зависимость. Для того чтобы определить информационный объём, который заключается в сообщении, прибегают к специальному способу измерения, которое выражается в формуле мощности алфавита: N = 2 в n -ной степени.
Эта формула была изобретена американским инженером Ральфом Хартли более сотни лет тому назад. Она применяется для работы с равновероятными событиями и используется для определения мощности конкретного буквенного набора, которая обозначается буквой N (информационная масса или объём). n означает численность бит в словесной единице, иными словами, количество знаков внутри двоичного кода. Так, если n равен 1, то N тоже равен 1, при n = 2 N = 4, при n = 3 N = 8, при n = 4 N = 16.
Чтобы сформулировать теорию о численности информации в набранном словосочетании, пользуются формулой I=K*i. В этом случае К обозначает численность всех символов в предложении, а i — это информационная масса символа.
При ответе на вопрос, как найти мощность алфавита, нужно сказать, что в русском языке 33 буквы, поэтому это можно выразить как N = 33. Для сравнения, аналогичный показатель в английском, немецком и французском языках равняется 26, в испанском — 27. Венгерский язык, например, является 40-символьным.
Существует также и клавиатурный язык, куда входят не только буквы, но и дополнительные знаки. Так, в русском языке есть ещё 10 цифр и 11 символов, а также пробел и пара скобок. Их мощность прибавляется к аналогичному буквенному показателю, и на выходе получается N = 33+10+11+1+2=57. В некоторых случаях букву «ё» не выделяют в качестве отдельного самостоятельного символа, и в таком случае полная мощность русского алфавита становится равна 56.
Определение информационного объёма в тексте
Почти всегда при наборе текста на компьютерах и других электронных устройствах приходится сталкиваться с написанием различных символов. К ним следует отнести:
- заглавные и жирные буквы;
- курсив;
- скобки;
- знаки препинания;
- вычислительные операции и прочее.
По всем расчётам получается, что мощность компьютерного алфавита составляет 256 различных символов и вариантов. В соответствии с формулой Хартли, N = 256, а i — масса любого из значков в клавиатурном алфавите соответствует одному байту, или восьми битам.
Размер любой напечатанной фразы может быть вычислен по формуле V=K ⋅ log2N. В этом случае N обозначает количество всех символов в алфавите, а K — это численность знаков непосредственно в напечатанной фразе. Так, например, имеется произвольный текст объёмом в 25 листов. На каждом из них расположено по 45 строчек текста, содержащих по 58 символов.
Исходя из этого, на любой отдельной странице будет 45*58 = 2610 байт информации. В целом же по всему тексту этот объём будет равен 2610*25 = 65250 байт. Для обозначения мощности алфавита в информатике общепринятым вариантом является буква N из формулы Хартли. Именно ее чаще всего указывают в большинстве учебников и профессиональной литературе.
В кодовой таблице ASCII используют восьмибитную кодировку текстовых сообщений. Она позволяет полностью вместить основной набор символов кириллического и латинского алфавитов как в строчном, так и в прописном вариантах. Также с её помощью можно отобразить знаки препинания, цифры и прочие базовые знаки. Часто пользователям приходится иметь дело с более крупными объёмами, состоящими из триллионов байтов.
Для удобства их всегда переводят в увеличенные величины — кило-, мега-, гигабайты и прочее. Для их упрощённого обозначения используются специальные сокращения: Кб, Мб, Гб и так далее. 1 Кб равняется 1024 байтам (2 байта в десятой степени), 1 Мб составляет 1024 Кб (2 Кб в десятой степени) и так далее. Исходя из этого, 65250 байт будут составлять 63,72 килобайта.
Поскольку один отдельный символ состоит из 8 битов, то устанавливать их кодировку целиком не представляется возможным. Вместо этого предпочтительнее образовать кодировку трёхбитовых комбинаций. Расчёт этого действия проводится по формуле Хартли, где n-ная степень будет равняться трём. В результате получается N, равная 8.
При определении мощности чаще всего используют алфавитный подход. Он говорит о том, что объём информации, заложенной в тексте, зависит исключительно от мощности самого алфавита и размера сообщения (то есть количества символов, содержащихся в нём). Этот показатель не имеет никакой связи со смысловым наполнением для человека.
Примеры расчёта мощности
От пользователей или обучающихся в задачах часто требуют научиться определять информационный объём какого-либо сообщения, приняв информационный вес символа за один байт. Так, в отрывке из поэмы Н. Н. Некрасова «Крестьянские дети»:
Я из лесу вышел; был сильный мороз»
будет 67 символов вместе с пробелами, то есть, в соответствии с условиями задания, 67 байт. Их количество умножают на 8 (количество битов в байте), и на выходе получается 536 битов.
Таким образом, зная в теории суть мощности, можно без проблем определять информационный объем различных сообщений.
Цель урока:
- Иметь представление об алфавитном подходе к определению количества информации;
- Знать формулу для определения количества информационных сообщений,количества информации в сообщений;
- Уметь решать задачи на определение количества информационных сообщений и количества информации, которое несет полученное сообщение.
Ход урока
1. Актуализация знаний:
— Ребята давайте понаблюдаем за тем , что мы видим за окном. Что вы можете сказать о природе? (Наступила зима.)
— Но почему вы решили, что наступила зима? (Холодно , идет снег.)
— Но ведь нигде не написано, что это признаки зимы. (Но мы знаем, что все это означает: наступила зима.)
Поэтому и получается, что , то знание, которое мы извлекаем из окружающей действительности и есть информация. (слайд 1)
Заполнить таблицу и стрелочками показать соответствия.
Носители информации | Их использование |
Дискета | Написать письмо |
Бумага | Записать компьютерную игру |
Аудиокассета | Сделать фотоизображение |
Фотопленка | Записать исполнение песни |
Видеокассета | Записать ноты песни |
— Можно ли измерить количество информации и как это сделать? (Да)
Оказывается, информацию также можно измерять и находить ее количество.
Существуют два подхода к измерению информации. С одним из них мы сегодня познакомимся. (Смотри приложение слайд 2)
2. Изучение нового материала.
Каким образом можно найти количество информации?
У нас есть небольшой текст, написанный на русском языке. Он состоит из букв русского алфавита, цифр, знаков препинания. Для простоты будем считать, что символы в тексте присутствуют с одинаковой вероятностью.
Множество используемых в тексте символов называется алфавитом.
В информатике под алфавитом понимают не только буквы, но и цифры, и знаки препинания, и другие специальные знаки.
У алфавита есть размер (полное количество символов), который называется мощностью алфавита. При алфавитном подходе считается, что каждый символ текста имеет определенный “информационный вес”. С увеличением мощности алфавита увеличивается информационный вес символов этого алфавита.
Обозначим мощность алфавита через N.
Найдем зависимость между информационным весом символа (i) и мощностью алфавита (N). Самый наименьший алфавит содержит 2 символа, которые обозначаются “0” и “1”. Информационный вес символа двоичного алфавита принят за единицу информации и называется 1 бит. (Cмотри приложение слайд 3)
N | 2 | 4 | 8 | 16 | 32 | 64 | 128 | 256 |
i | 1бит | 2бит | 3бит | 4бит | 5бит | 6бит | 7бит | 8бит |
N= 2 i
В компьютере также используется свой алфавит, который можно назвать компьютерным. Количество символов, которое в него входит, равно 256 символов. Это мощность компьютерного алфавита.
Также мы выяснили, что закодировать 256 разных символов можно показать с помощью 8 битов.
8 бит является настолько характерной величиной, что ей присвоили свое название – байт.
Используя этот факт: можно быстро подсчитать количество информации, содержащееся в компьютерном тексте, т.е.в тексте набранном с помощью компьютера, учитывая, что большинство статей, книг, публикаций и т.д. написаны с помощью текстовых редакторов, то таким способом можно найти информационный объем любого сообщения, созданного подобным образом.
Правило для измерения информации с точки зрения алфавитного подхода посмотрим на слайде. (Cмотри приложение слайд 4)
Пример:
Найти информационный объем страницы компьютерного текста.
1. Найдем мощность: N=256
2. Найдем информационный объем одного символа : N= 2 i i = 8 бит = 1 байт.
3. Найдем количество символов на странице. Примерно.
(Найти количество символов в строке и умножить на количество строк)
Пусть дети выберут произвольную строку и подсчитают количество символов в ней, учитывая все знаки препинания и пробелы.
40 символов * 50 строк = 2000символов.
4. Найдем информационный объем всей страницы: 2000 * 1 = 2000 байтам
Согласитесь, что байт – маленькая единица измерения информации. Для измерения больших объемов информации используют следующие единицы (Cмотри приложение слайд5)
3. Закрепление изученного материала.
Заполнить пропуски числами и проверить правильность.
1 Кбайт = ___ байт = ______бит,
2 Кбайт = _____ байт =______бит,
24576 бит =_____байт =_____Кбайт,
512 Кбайт = ___ байт =_____бит.
Предлагается ученикам задачи:
1) Сообщение записано с помощью алфавита, содержащего 8 символов. Какое количество информации несет одна буква этого алфавита?
Решение: N=8 , то i= 3 битам
2) Сообщение , записанное буквами из 128-символьного алфавита, содержит 30 символов. Какой объем информации оно несет?
1. N= 128 , K=30
2. N= 2 i i= 7 битам (объем одного символа)
3. I = 30*7 = 210бит (объем всего сообщения)
4. Творческая работа.
Наберите на компьютере текст, информационный объем которого равен 240 байт.
5. Итоги урока.
— Что нового сегодня мы узнали на уроке?
— Как определяется количество информации с алфавитной точки зрения?
— Как найти мощность алфавита?
— Чему равен 1байт?
6. Домашнее задание (Cмотри приложение слайд 6).
Выучить правило для измерения информации с точки зрения алфавитного подхода.
Выучить единицы измерения информации.
1) Мощность некоторого алфавита равна 64 символам. Каким будет объем информации в тексте, состоящем из 100символов.
2) Информационный объем сообщения равен 4096 бит. Оно содержит 1024 символа. Какова мощность алфавита, с помощью которого составлено это сообщение?