Шрифт:
Интервал:
Закладка:
Как говаривал друг Винни-Пуха ослик Иа-Иа — «душераздирающее зрелище»! Геном бактерии построен куда рациональнее. Тогда что же такое прогресс?
Моя точка зрения на эту проблему проста: с получением новых экспериментальных данных термин «мусорная» будет применяться не к ДНК, а к той литературе, где он всерьез употребляется. Это я говорил еще в 1980 году, прочитав знаменитый номер «Nature», говорю и сейчас — с гораздо большим основанием. А тогда единственным моим доводом была аналогия с передачей лингвистической информации, и ссылаться приходилось только на самые общие положения теории Шеннона.
Дело в том, что в любом канале передачи информации существуют помехи. Канал без помех — такая же невозможная абстракция, как и двигатель со 100% КПД. Поэтому сигнал на пути от передатчика к приемнику искажается — порой настолько, что не может быть использован в практической деятельности. Информация, в общем, просто теряется, обращаясь в шум. Один из законов Шеннона это постулирует: в процессе передачи информация может только теряться, но не увеличиваться. Этот закон — точный аналог второго начала термодинамики, согласно которому энтропия замкнутой системы может только возрастать.
И в нашем случае возрастает энтропия передаваемого текста и энтропия на символ. Например, энтропия на символ в диктанте второгодника существенно выше соответствующей величины для орфографического словаря. Чтобы сохранить информацию в сигнале, необходимо построить его таким образом, чтобы он был помехоустойчивым.
И теория связи, придуманная людьми, и те закономерности, по которым формирует свои сигналы живая природа, предусматривают немало способов повышения помехоустойчивости информационных каналов. Все их нельзя рассмотреть в общедоступной книге. Но важно подчеркнуть одно — все они в той или иной мере сводятся к удлинению сигнала, увеличению времени его передачи — короче, к понижению плотности кодирования генетической информации. К чему это сводится на практике?
Письмо капитана Гранта. Полагаю, в детстве все вы читали захватывающую историю Жюль Верна, которая начиналась с того, что в брюхе акулы была найдена бутылка, а в той бутылке — три записки. Море смыло часть текста, но можно было догадаться, что они написаны на разных языках — английском, немецком и французском. Остаток английского текста гласил:
… 62… Bri… gow… sink… stra… aland… skipp… Gr…… that monit… of long… and… ssistance… lost…
To же на немецком:
… 7 Juni… Glas… zwei… atrosen… graus… bringt ihnen…
Видимо, Жюль Берн знал немецкий хуже английского. По той же причине лучше всего сохранился французский текст документа:
… troi… ats… tannia… gonie…austral… abor… contin… pr… cruel… indi…jete… ongit et 37°11'… lat…
Казалось бы, немного. Но герои романа во главе с Жаком Паганелем в конце концов, ошибаясь и в процессе кругосветного путешествия исправляя ошибки, уверенно восстановили текст, за исключением одного слова. Вот как выглядел текст в переводе на русский язык:
«27 июня 1862 года трехмачтовое судно «Британия» из Глазго потерпело крушение в тысяче пятистах лье от Патагонии, в Южном полушарии. Два матроса и капитан Грант добрались до острова Табор. Здесь, постоянно терпя жестокие лишения, они бросили этот документ под 153° долготы и 37°11" широты. Придите им на помощь".
Я подчеркнул те слова и части слов, которые сохранило море. Чем для нас примечательна эта выдуманная история? Прежде всего, тем, что текст повторен трижды. Будь копии одноязычными, результат был бы тот же: помехоустойчивость сигнала возросла бы. Примечательно, что Паганель споткнулся на слове «Табор» — оно имелось только во французском тексте и, значит, не обладало трехкратной избыточностью. Впрочем, будь оно расшифровано, героям романа не пришлось бы совершать кругосветное плавание, и роман вообще бы не состоялся.
Сопоставим это с тем фактом, что каждый из нас имеет двойной, диплоидный, набор генов — от отца и от матери. Как говорят генетики, наши организмы на всем протяжении развития от оплодотворенной яйцеклетки, зиготы, находятся в диплофазе. Только наши гаметы — спермии и яйцеклетки гаплоидны, имеют один набор генов.
Но это не общий для всей природы закон. Высшие растения имеют две стадии развития — гаплофазу и диплофазу. Но и у них гаплофаза редуцирована и, в конце концов, паразитирует на диплофазе, являясь частью цветка. Мужской гаплоидный организм цветковых состоит всего-то из трех клеток (пыльцевое зерно). А многие простейшие, грибы и водоросли на протяжении большей части жизни живут в гаплофазе. У них диплоидна только зигота. Гаплоидны и бактерии.
Какой вывод можно сделать из этого? По-видимому, дублирование, а то и многократное повторение генетической информации необходимо для прогрессивной эволюции. И необходимо именно потому, что повышает помехоустойчивость. Если генетический текст повторен трижды, возникают триплоиды. Они бесплодны при половом размножении, но отличаются мощностью роста, высокой жизненной устойчивостью. Таковы гигантская триплоидная осина, бессемянный культурный банан и многие другие сорта растений, а также триплоидные земноводные и рыбы.
Но это не единственный вывод, который можно сделать, анализируя с точки зрения теории информации письмо капитана Гранта. Возьмите русский перевод. В нем 48 слов, из коих можно восстановить 25. Но для понимания смысла текста многие слова лишние, такие как «трехмачтовое судно», «в тысяче пятистах лье от Патагонии» (обрывок последнего слова вынудил Гленарвана со спутниками пересечь Анды и пампасы), «в южном полушарии» (моряк так бы не написал, он ограничился бы аббревиатурой Ю. Ш., точнее s.l.), «здесь они бросили этот документ». Так что для понимания смысла достаточно было 32 слов, многие из которых восстанавливаются по обрывкам: Bri, gow, stra, aland, contin, indi… ongit и т. д.
Получается, что многие символы в тексте письма лишние? Ведь и без них можно обойтись?
Да, лишние. А значит, следуя логике авторов модной гипотезы, их бы следовало назвать «эгоистическими, паразитическими, мусорными» и т. д.
Вы скажете, конечно, что здесь что-то не так. Вот мы и подошли к важному выводу теории информации: все человеческие языки построены со значительной избыточностью. Как оценить степень этой избыточности? Абсолютно точное определение этой величины нереально, хотя бы потому, что избыточность — свойство не языка, а написанного на нем текста. Но, сопоставив много разных текстов, мы можем вывести нечто среднее, характеризующее язык, что-то вроде средней температуры по больнице. Метод определения доступен каждому. Его можно назвать хотя бы методом Паганеля, а суть его — моделирование письма капитана Гранта.
В такую игру удобнее играть вдвоем. Один, по возможности случайно, выбирает кусок текста, неизвестного партнеру. Достаточно примерно тысячи знаков. Затем, пользуясь таблицей случайных чисел, из него вычеркивают 10, 20, 50 и т. д. процентов знаков. Второй игрок должен текст восстановить. Так определяется избыточность текста, выражающаяся в процентах «лишних» символов, без которых задачу можно решить. Хорошо для этой цели использовать персональный компьютер.
Подобные опыты, проведенные в разных странах, на разноязычных текстах, дают близкие цифры: примерно до 80% символов в лингвистической информации оказываются лишними. Мы могли бы говорить и писать в пять раз экономнее — но сколько времени мы бы тогда тратили на расшифровку сообщения?
В принципе, возможно построить совершенно безызбыточный язык, так называемый оптимальный код. В нем каждое случайное сочетание букв означало бы осмысленное слово. Но пользоваться им было бы невозможно. Как в свое время заметил И. А. Полетаев, «никакой аптекарь не рискнул бы выполнить рецепт, написанный типичным врачебным почерком, если бы ошибка в одной букве меняла слово «аспирин» на слово «стрихнин»». Да и жизнь машинисток и наборщиков, телеграфистов и редакторов была бы сплошным мучением.
Конечно, в одном и том же канале можно встретить разные по избыточности тексты. Хорошо бы таким способом сравнить плотность информационного содержания в текстах, например, Хемингуэя и Проскурина. Убежден, что не только теория информации, но и теория литературы почерпнула бы от таких экспериментов немало полезного. Напомню, что Проспер Мериме, отчаявшись перевести пушкинский «Анчар» на французский язык, сделал это по-латыни. Значит ли это, что французский язык избыточнее русского? Вряд ли: в стихотворениях хотя бы Франсуа Вийона плотность информации не меньше пушкинской:
- Трилобиты: Свидетели эволюции - Ричард Форти - Биология
- Величайшее Шоу на Земле: свидетельства эволюции - Ричард Докинз - Биология
- Вселенная внутри нас: что общего у камней, планет и людей - Нил Шубин - Биология
- Я — не моя ДНК. Генетика предполагает, эпигенетика располагает - Манель Эстейер - Биология
- Мутанты. О генетической изменчивости и человеческом теле. - Арман Мари Леруа - Биология
- Занимательная физиология - Борис Сергеев - Биология
- Систематика и эволюция (Критика исторического понимания системы организмов) - Александр Любищев - Биология
- Лестница жизни - Ник Лейн - Биология
- Эволюция для всех, или Путь кентавра - Александр Гангнус - Биология
- Дисбактериоз кишечника у детей - Юрий Копанев - Биология