Читать книгу Слова и числа - Владимир Валентинович Трошин - Страница 4
Часть 1. Буквы и слова
Буквы и алфавит
ОглавлениеЛюбая форма письменности представляет собой кодирование информации с помощью специальных значков. Чтобы понять закодированное сообщение, нужно знать код, то есть знать, что обозначает каждый знак. Между количеством знаков в коде и длиной текста, записанного с его помощью, прослеживается интересная закономерность, называемая в математике обратной пропорциональностью. Чем больше знаков содержит сам код, тем короче текст, записанный с его помощью, и наоборот, чем меньше знаков в коде, тем длиннее записанный текст. Например, чтобы читать текст на китайском языке, нужно помнить начертание тысяч иероглифов, но иероглифические тексты, сравнительно с текстами других систем письма, наиболее короткие. В то же время, самый короткий код может состоять всего из двух знаков. Пример подобного кода, успешно применявшегося в практике общения и передачи информации – это телеграфная азбука Морзе, которая содержит только два знака · и – , то есть «точку» и «тире». В фильмах о разведчиках мы видим, как радисты передают секретные сообщения с помощью этой азбуки. Назван этот код в честь американского изобретателя и художника Сэмюэля Морзе, который в 1838 году предложил систему передачи текстов с помощью телеграфа. Потом система менялась и совершенствовалась, адаптировалась к другим языкам. Покажем интернациональную кодировку букв и цифр по принципу Морзе.
Две буквы можно закодировать, используя один знак: точка – буква E, тире – буква T. При составлении кода учитывалась частота соответствующих букв в англоязычных текстах. С помощью двух знаков можно закодировать еще четыре буквы – это две точки – буква I, два тире – буква M, точка тире – буква A, тире точка – буква. N. Здесь идет чистая математика. С помощью трех знаков можно закодировать 23=8 букв, с помощью четырех знаков 24=16 букв. Таким образом, используя от одного до четырех знаков (точек и тире) можно закодировать 2+4+8+16=30 букв. Практически остались неиспользованными четыре варианта кодировки четырьмя знаками, так как для английского алфавита в 26 букв хватило знаков с избытком. Цифры решили кодировать, используя по пять знаков для каждой. С математической точки зрения наборами из пяти точек или тире можно закодировать еще 25=32 знака.
В фильмах о разведчиках сообщения дополнительно для большей секретности кодируется цифрами и бедным радистам приходится выстукивать вместо коротких букв, пятизначные коды цифр. Не подумал Морзе о секретных службах, а то бы начал свою систему кодировки не с букв, а с цифр: точка – ноль, тире – единица и так далее. Сообщения были бы намного короче, и радистов труднее было бы запеленговать.
В наше время в вычислительной технике используется двоичное кодирование. Двоичный код состоит тоже из двух знаков 0 и 1, с помощью которых происходит промежуточное кодирование всех знаков алфавитного письма, а затем уже кодирование текста. Количество информации содержащейся в 0 или 1 принимается за 1 бит. Подход к кодированию букв, цифр и знаков изначально был принят другой. Все они кодируются наборами из восьми нулей или единиц. Набор из восьми нулей или единиц несет 1 байт информации. Следовательно, любой знак обычного текста содержит 1 байт информации. Этим кодом, который назвали КОИ-8 можно закодировать 28=256 различных знаков. Хватит на буквы английского и родного алфавита, а так же на знаки препинания, цифры и еще массу дополнительных знаков. В последнее время перешли с КОИ-8 на Юникод, который представляет собой кодировку с фиксированным размером символа в 16 бит или 2 байта и позволяет закодировать 216=65 536 знаков. Юникод включает в себя знаки почти всех письменных языков мира. В результате применения подобной системы кодирования, даже короткое предложение будет представлено сотнями знаков 0 и 1 в определенной последовательности, и только быстродействие компьютеров оправдывает использование двоичного кодирования информации.
Таким образом, при создании новых систем передачи информации, приходится учитывать специфику задач конкретной области знаний и балансировать между оптимальной длиной кода и оптимальной длиной текста. Для современной письменности такой золотой серединой являются буквенные алфавиты, содержащие от 25 до 35 знаков, которыми кодируется звуковая речь. Большинство языков имеют алфавитную письменность. Самый короткий алфавит распространен на острове Бугенвиль Соломоновых островов. Он содержит только 11 букв. Гавайский алфавит, созданный на основе латинского, имеет 13 букв. В самом длинном камбоджийском алфавите 72 буквы. С тех пор, как 3500 лет назад был создан первый алфавит, появилось более 200 различных способов записи звуков устной речи.
Большинство языков использует алфавиты, созданные на основе латинского алфавита или латиницы. Сюда относятся многие европейские языки и наиболее значимый из них в современном мире – английский. Если мы произнесем «латинский алфавит», и возьмемся перечислить его буквы, то сразу можем столкнуться с путаницей. Латинский алфавит обособился примерно в VII веке до н. э. и первоначально включал только 21 букву: A, B, C, D, E, F, Z, H, I, K, L, M, N, O, P, Q, R, S, T, V, X. В I веке до н. э., после завоевания Римом Греции, были добавлены буквы Y и Z для записи слов, заимствованных из греческого языка. В итоге получился классический латинский алфавит из 23 букв. Уже в новое время, около XVI века произошла дифференциация слоговых и неслоговых вариантов букв I и V и добавились буквы J и U. В итоге получился новый латинский алфавит из 25 букв. Чем же отличается английский алфавит от нового латинского по буквенному составу? В английском языке 26 букв, добавлена еще буква W.
Кириллица является вторым по распространенности алфавитом, используемым для записи русского, украинского, болгарского и многих других языков. Некоторые из них используют дополнительные буквы. Первоначально кириллица содержала 43 буквы, сейчас в русском языке их осталось 33. Интересная картина: латинский язык прирастал буквами и английский, выйдя из него, тоже добавил одну букву. Кириллица сразу была «зело богата» буквами и приходилось только сокращать излишки.
Третий по распространенности арабский алфавит. Он происходит от арамейского и возник примерно в 4 веке нашей эры. Арабский алфавит содержит 28 букв для обозначения согласных, а гласные пишутся выше или ниже согласных. Порядок записи знаков справа налево. Необычным в нем является и то, что одна и та же буква пишется неодинаково в зависимости от того, какое место она занимает – стоит отдельно, или стоит в начале слова, в середине, в конце. Можно много говорить о разнообразии и своеобразии чужих алфавитов, но пора заострить внимание на родном – русском.
Создателями славянской азбуки были просвещённые братья Кирилл и Мефодий, происходившие родом из греческого города Салоники. Приблизительно в середине 9 века они перевели с греческого на старославянский язык христианские богослужебные книги. Отдавая им дань уважения, следует заметить, что в происхождении двух славянских алфавитов глаголицы и кириллицы остается много неразгаданного. Большинство ученых считают, что Кирилл создал все-таки глаголицу, а кириллица была составлена в Восточной Болгарии для приближения славянского письма к торжественному византийскому. До 11-12 веков кириллица и глаголица употреблялись параллельно, впоследствии кириллица вытеснила глаголицу. Состав и форма букв кириллицы изменялись с течением времени. Серьезную реформу русской азбуки провел Петр I в 1708 и 1710 годах. Он изъял несколько дублетных букв, обозначающих один и тот же звук, ввел в состав алфавита букву э, установил разное начертание прописных и строчных букв, отменил цифровое значение кириллических букв и ввел арабские цифры, утвердил графику гражданского шрифта для печати светских книг.
Реформы Петра I затрагивали состав алфавита и графику, но не коснулись орфографии, то есть правописания, которое оставалось очень сложным. Провести дальнейшее упорядочение алфавита и упрощение правописания, следовательно, его демократизацию, удалось только в 1917-1918 годах. Чтобы ни говорили о советской власти современные реформаторы, но писать стало проще и удалось добиться всеобщей грамотности населения огромной страны. Только некоторых почитателей старины даже в наше время так и тянет написать коммерсантъ.
Устная речь состоит из звуков. В письменной речи звуки обозначаются буквами. Сейчас вы читаете текст, и далее повествование будет проходить в письменном виде, поэтому теперь наш путь обратно от буквы к слову.
Буквы – это условные знаки, которыми обозначаются звуки речи на письме.
В русском языке 33 буквы. Перечень букв, в принятом порядке называется алфавитом.
Буквы делятся на гласные и согласные. В русском алфавите 10 гласных букв: а, е, ё, и, о, у, ы, э, ю, я;
20 согласных букв: б, в, г, д, ж, з, к, л, м, н, п, р, с, т, ф, х, ц, ч, ш, щ, и остаются ещё три сиротинушки.
й – одиннадцатая буква русского алфавита, называется и краткое, обозначает полугласный звук. Звук й не образует слога и тем сходен с согласным.
Буквы ъ и ь не обозначают никаких звуков.
ъ – двадцать восьмая буква русского алфавита, называется твердый знак. В современной орфографии употребляется лишь как разделительный знак (например: разъезд, объявление).
ь – тридцатая буква русского алфавита, называется мягкий знак. Её употребление в современной орфографии гораздо шире:
– для обозначения мягкости предшествующего согласного;
– как разделительный знак перед я, ю, е, ё;
– в окончании именительного и винительного падежей единственного числа существительных женского рода на ч и щ, а также на ж и ш;
– в повелительной форме глагола, оканчивающегося на ч, ш, ж;
– в неопределенной форме глагола;
– во 2-ом лице единственного числа настоящего и будущего простого времени.
Согласные в свою очередь делятся на 10 звонких и 10 глухих. Кроме того, 4 согласные буквы называются шипящими, причем одна из них (ж) находится в звонких, а три (ч, ш, щ) в глухих согласных. Это неизменные атрибуты букв. Но есть еще деление букв, которое не является постоянным, а изменяется в зависимости от слов, в которых они употребляются.
Гласные буквы делятся на ударные и безударные. Если в слове больше одного слога, то слоги произносятся с разной силой. Один из них выделяется голосом, он называется ударным. Гласная буква в слове, на которую приходится ударение, называется ударной; все остальные гласные в слове называются безударными.
Большинство согласных в слове бывают твердыми или мягкими. На письме мягкость предшествующего согласного обозначается буквами е, ё, и, ь, ю, я. Причем согласные ж, ц, ш в русском языке произносятся всегда твердо, а согласные ч, щ – только мягко.
Все буквы могут быть написаны большими (прописными) или маленькими (строчными). Большая буква начинает предложение, с большой буквы пишутся имена собственные, различные названия.
Система письма, основанная на подобном алфавите, называется консонантно-вокалической, то есть согласно-гласной.
Со стороны наш алфавит кажется четкой устоявшейся системой, и только присмотревшись, понимаешь, не все пока бесспорно. В среде филологов нет единого мнения по поводу буквы ё: одни её считают полноправным членом алфавита, другие – нет. Что греха таить, при наборе текста на клавиатуре мы редко употребляем эту букву, заменяя её буквой е. Даже клавиша с этой буквой спряталась в левом верхнем углу клавиатуры, и нажимаем мы её реже других, только когда особо держим в голове, что нужно набрать именно эту букву. В результате приходится сталкиваться с поразительными фактами. В солидном словаре:
Словарь русского языка: В 4-х т.
АН СССР, Ин-т рус. яз.;
под. ред. А П. Евгеньевой
М.: Русский язык, 1985-1988,
приведен полный алфавит в начале каждого тома. В самом же словаре про букву е сказано, что она шестая, про букву и сказано, что она девятая, буква у – двадцатая, э – тридцать первая, я – тридцать третья. Посмотрите на алфавит и посчитайте. Получается, что буква ё – никакая. Всех сосчитали, а её – нет. Как это может быть – непонятно. Уже этот факт говорит о том, что и словесникам неплохо бы знать математику. Поэтому, отбросив споры языковедов, возьмем за аксиому (как говорят математики), что в русском алфавите 33 равноправных буквы. Еще одно замечание касается названия буквы э. Иногда её называется просто э, а иногда э оборотное. Будем проще, то есть называть эту букву э.
В некоторых книгах приводится алфавит, в котором три буквы ъ, ы, ь написаны только маленькими и для них нет написания большой буквы [19]. Тем самым, наверное, хотят подчеркнуть, что эти буквы не могут стоять в начале слова. В «Этимологическом словаре русского языка» М. Фасмера особо указано, что буква ы никогда не может начинать слово. Действительно, твердый знак и мягкий знак не могут стоять в начале слова. Правда, при перечислении букв, мне пришлось поставить их в начале предложения. Как их нужно было написать? Сейчас на компьютерной клавиатуре эти знаки можно напечатать большими буквами и это правильное дополнение, ведь иногда заголовки статей в газетах, книгах набирают целиком большими буквами, чтобы выделить их графически. Относительно буквы ы появились примеры, опровергающие приведенные высказывания. Она может стоять в начале слова, это подтвердили поиски в различных словарях и географическом атласе. Например, в Туве существует село Ырбан, в Коми – гора Ыджыдпарма. У тюркских народов есть музыкальный жанр, который называется ыр. Вот вам эта буква в начале слова и прописная и строчная. Дело в том, что язык, как совокупность слов не является чем-то раз и навсегда зафиксированным. Различные народы общаются между собой, мировая цивилизация воспринимается как нечто единое, и происходит взаимопроникновение языков. Слова, возникшие в одном языке, заимствуются другими в результате глобальных общепланетных процессов. Река, протекающая где-то в Замбии, должна быть как-то названа в русском издании Атласа мира, это касается и названий городов, государств. Отдельные личности по результатам своей деятельности становятся общеизвестными и их имена включаются в энциклопедические словари других стран, следовательно, входят в различные языки. Пределом этого развития должно стать создание единого общепланетного языка землян. Подобные попытки делались, например, язык эсперанто, но они были искусственны. Русская поговорка гласит: «Насильно мил не будешь». Кроме географических названий, имен людей, незримый процесс глобализации языка идет в математике, химии, где ученые всех стран используют одинаковые знаки цифр, символы операций, знаки и формулы химических элементов и соединений. Математические и химические выражения уже стали общепонятны. Процесс идет!