авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:   || 2 |
-- [ Страница 1 ] --

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ

ИНСТИТУТ ХИМИЧЕСКОЙ ФИЗИКИ ИМ. Н.Н.СЕМЕНОВА

РОССИЙСКОЙ АКАДЕМИИ НАУК

На правах рукописи

ВАЛЬБА ОЛЬГА ВЛАДИМИРОВНА

Топологические особенности РНК-подобных молекул со случайной

первичной структурой

Специальность 01.04.17 — Химическая физика, горение и взрыв, физика

экстремальных состояний вещества Диссертация на соискание учёной степени кандидата физико-математических наук

Научный руководитель:

д.ф.-м.н., Аветисов В.А.

Москва – Оглавление Введение 1 Обзор литературы 1.1 Особенности пространственной структуры молекул РНК......... 1.2 Методы предсказания структуры РНК.................... 1.3 Случайная первичная структура РНК.................... 1.4 Термодинамические свойства........................ 1.5 Описание РНК структур случайными матрицами............. 2 Алгоритмы вычисления свободной энергии РНК-подобных структур 2.1 Выравнивание последовательностей..................... 2.2 Комплементарное связывание биополимеров................ 2.3 Связывание РНК с внутрипетлевым взаимодействием........... 2.4 Алгоритмы восстановления структуры................... 3 Свойства РНК структур со случайной последовательностью звеньев 3.1 Свободная энергия основного состояния.................. 3.2 Распределение длин петель в РНК-подобных структурах......... 4 Топология РНК-подобных молекул в зависимости от алфавита случайной первичной структуры 4.1 Зависимость свободной энергии РНК-подобных структур от алфавита. 4.2 Топологический переход в модели Бернулли................ 4.3 Аналитическая оценка критической точки топологического перехода в модели Бернулли................................ 4.3.1 Метод среднего поля......................... 4.3.2 Комбинаторная оценка........................ 4.3.3 Матричный подход.......................... 4.4 Переход случайной РНК в замороженное состояние, ограниченный то пологическим переходом.

.......................... 4.5 Другие модели нецелого алфавита...................... 4.5.1 Метод концентраций......................... 4.5.2 Коррелированная случайная последовательность......... 4.5.3 Рациональный алфавит........................ 5 Описание РНК-подобной структуры в терминах оптимизационной транс портной задачи 5.1 Оптимизационная транспортная задача................... 5.2 Модель случайных интервалов первичной структуры РНК-подобной мо лекулы..................................... 5.3 Топологические свойства РНК-подобных структур в модели случайных интервалов................................... 5.3.1 Численное моделирование...................... 5.3.2 Аналитическое описание....................... Заключение Список сокращений и условных обозначений Литература Введение Актуальность темы исследования. Структура важнейших биологических макромо лекул, таких как дезоксирибонуклеиновые кислоты (ДНК), рибонуклеиновые кислоты (РНК) и белки, играет ключевую роль в их правильном функционировании в клетке.

Различают три уровня структурной упорядоченности биомакромолекул. Одна из ос новных их особенностей состоит в гетерополимерности. Последовательность звеньев в ДНК, РНК и белках индивидуального организма, она называется первичной структурой, строго зафиксирована. Далее, биополимерные цепи могут формировать спиралеобраз ные и складчатые участки небольшого масштаба, как в белках, или комплементарно спаренные и петлевые участки, как в РНК. Такие фрагменты называются элементами вторичной структуры. Различают также третичную и четвертичную пространственные структуры биополимеров.

Данная работа посвящена исследованию топологических свойств вторичной струк туры молекул РНК-типа. Известно, что биомакромолекулы являются «слабо отредакти рованными случайными гетерополимерами» [1,2]. Более того, для ряда свойств распре деление мономерных звеньев в первичной структуре, например, функциональных РНК можно считать случайным [3, 4]. В этом случае, модель случайной первичной структу ры является базовой моделью, описывающей основной (нулевой) вклад в наблюдаемые физические явления. Основное внимание при этом сфокусировано на нетривиальной вторичной структуре РНК-подобных полимеров, для описания которой привлекаются разнообразные техники, в том числе, техники квантовой теории поля и моделей Изин га [5].

Цель работы заключается в описании топологических особенностей РНК-подобных последовательностей методами статистической физики и теории случайных процессов.

Для достижения поставленной цели необходимо было решить следующие задачи:

1. Разработать алгоритм вычисления свободной энергии РНК-подобной молекулы;

2. Исследовать статистические свойства распределения свободной энергии в ансам бле РНК-подобных структур со случайной последовательностью звеньев;

3. Изучить зависимость топологических свойств РНК-подобных структур от коли чества типов мономерных звеньев (алфавита), используемого в случайных пер вичных структурах.

Научная новизна работы заключается в следующем.

1. Впервые методами статистической физики и теории случайных процессов иссле дованы изменения топологических свойств РНК-подобных гетерополимеров со случайной первичной структурой в зависимости от их длины и используемого в первичной структуре алфавита.

2. Впервые теоретически обнаружено критическое изменение топологии РНК подобных структур при переходе от двухбуквенного алфавита к трехбуквенному и проведена аналитическая оценка точки перехода в рамках комбинаторного и матричного описания.

3. Впервые установлена взаимосвязь между наблюдаемым критическим изменени ем топологии РНК-подобных структур и переходом в замороженное состояние, который обсуждался ранее в работах Т. Хва и Р. Бундшу.

4. Впервые показано, что описание топологии РНК-подобной структуры может быть сведено к оптимизационной транспортной задаче.

Теоретическая и практическая значимость диссертационной работы обусловле на тем что, полученные результаты носят фундаментальный характер и дают более глубокое понимание физических закономерностей, лежащих в основе формирования вторичной структуры молекул РНК.

Методы исследования. В работе использовалось компьютерное моделирование, включающее вычисление свободной энергии основного состояния РНК-подобных мо лекул и предсказание соответствующих вторичных структур. В аналитическом рас смотрении широко использовалась теория случайных процессов, а также описание вторичной структуры РНК случайными матрицами.

Основные положения, выносимые на защиту:

1. алгоритмы описания вторичной структуры РНК-подобной молекулы и вычисле ния свободной энергии основного состояния, учитывающие внутрипетлевое вза имодействие;

2. свойства распределения свободной энергии в ансамбле РНК-подобных структур со случайной последовательностью мономерных звеньев;

3. зависимость топологических свойств РНК-подобных структур от используемого в первичной структуре числа различных мономерных звеньев (алфавита). Крити ческое изменение топологии РНК-подобных структур при переходе от двухбук венного алфавита к трехбуквенному;

4. топологические свойства РНК-подобных структур с выбранным распределением расстояний между мономерными звеньями и потенциалом взаимодействия между мономерами, заданным выпуклой вниз функцией от расстояния.

Достоверность изложенных в работе результатов обеспечивается использованием широко апробированных методов. Результаты находятся в соответствии с результатами, полученными ранее другими авторами.

Апробация работы. Основные результаты работы докладывались и обсуждались на 12 конференциях и 11 семинарах. По результатам диссертации опубликованы 6 статей в 5 ведущих российских и международных журналах.

Личное вклад автора заключается в развитии методов описания РНК-подобных молекул со случайной первичной структурой. Им были разработаны соответствующие алгоритмы вычисления свободной энергии РНК-подобных молекул. Все приведенные в работе расчеты и обобщение полученных результатов были выполнены автором лично.

Диссертация состоит из пяти глав и заключения. Первая глава содержит обзор ли тературных данных. Рассматриваются топологические особенности молекул РНК, при водятся существующие подходы к предсказанию вторичной структуры РНК. Отдельно обсуждаются термодинамические свойства РНК со случайной первичной структурой и матричный подход описания вторичной структуры РНК.

Во Второй главе приводятся алгоритмы описания РНК-подобной структуры и вы числения свободной энергии ее основного состояния. Формулируется вспомогатель ная статистическая модель, описывающая взаимодействия мономерных звеньев в РНК подобной структуре с петлевыми участками. Далее, в предложенной модели учитывает ся вклад внутрипетлевого взаимодействия мономеров и приводится соответствующий алгоритм динамического программирования для вычисления энергии такой иерархиче ской структуры.

Третья глава диссертации посвящена определению свойств распределения свобод ной энергии ансамбля случайных последовательностей РНК. Обсуждаются такие ха рактеристики, как среднее значение свободной энергии в ансамбле, флуктуация средней энергии, распределение по длинам петель в пространственных структурах.

Анализ топологических свойств в модели случайной первичной структуры РНК подобной молекулы в зависимости от используемой в последовательности алфавита вынесен в отдельную Четвертую главу. Показывается, что в зависимости от алфави та РНК-подобная структура характеризуется либо максимально связанной вторичной структурой без пропусков (неспаренных мономеров), либо структурой с конечной долей несвязанных мономеров. Для определения точки такого топологического перехода фор мулируется модель Бернулли. В рамках предложенной модели приводятся численные и аналитические оценки критической точки перехода.

В Пятой главе описывается новый подход к описанию топологии РНК-подобных структур, сформулированный в терминах оптимизационной транспортной задачи. В рамках данного подхода аналитически и численно исследуются модели РНК-подобных структур, учитывающие взаимодействие между мономерными звеньями вдоль по цепи.

В Заключении представлены основные результаты диссертационной работы.

Глава Обзор литературы Глава посвящена обзору литературных данных. Обсуждаются особенности простран ственной структуры молекул РНК, приводятся известные алгоритмы предсказания та ких структур. Отдельно обсуждаются свойства РНК-подобных молекул со случайной последовательностью звеньев.

1.1 Особенности пространственной структуры молекул РНК РНК — одна из трёх основных макромолекул, которые содержатся в клетках всех живых организмов. Так же, как ДНК, РНК состоит из длинной цепи, в которой каж дое звено называется нуклеотидом. Последовательность нуклеотидов в цепи составляет первичную структуру РНК. Каждый нуклеотид состоит из азотистого основания, са хара (рибозы) и фосфатной группы. Последовательность нуклеотидов позволяет РНК кодировать генетическую информацию. Все клеточные организмы используют РНК для программирования синтеза белков, такая РНК называется матричной (мРНК).

Образование водородных связей между нуклеотидами обеспечивает вторичную структуру РНК. Азотистые основания в составе РНК могут образовывать водород ные связи между цитозином C и гуанином G, аденином A и урацилом U. Такие пары называют комплементарными (Рис. 1.1) и впервые были обнаружены Дж. Уотсоном и Ф. Криком [6]. Помимо комплементарных пар, водородные связи могут образовываться между основаниями U–G (Рис. 1.1). Такие пары называются неканоническими (Wobble base pairs). Неканонические пары U–G влияют на вторичную и третичную структуры РНК и ее функции. В частности, было показано, что такие пары играют существенную роль в процессе кодон-антикодон связывания [7]. Теоретические расчеты показали, что энергия пары U–G сравнима с энергией основных пар C–G и A–U [8] (Табл. 1.1), однако геометрия пары отличается от канонических пар [9]. Гликозидный угол — угол, который образует связь между азотом N и сахарным остатком с плоскостью цикла сахара, оди наков для всех оснований в комплементарных парах и отличается от соответствующих углов в неканонической паре (Рис. 1.1).

0, Пара d, A ккал/моль G–C -5.53 2. A–U -4.42 2. G–U -4.45 3. Рис. 1.1 Отличие Уотсон–Криковских пар Таблица 1.1 Теоретическая оценка от неканонической пары G–U. свободной энергии и длины связи в парах нуклеотидов [8].

Характерной особенностью структуры молекул РНК является то, что система ком плементарных связей вторичной структуры представляет собой «клеверный лист»

(Рис. 1.2 (a)). Такая кактусообразная структура схематически может быть представлена набором вложенных дуг (Рис. 1.2 (в)), где дуга — связь между комплементарно связан ными нуклеотидами в цепи. Псевдоузел — элемент вторичной структуры (Рис. 1.2 (б)) — образуется довольно редко и свойствен, в основном, длинным молекулам РНК. Псев доузел соответствует пересечению дуг в арочном представлении вторичной структуры (Рис. 1.2 (г)). Псевдоузлы часто несут важную функциональную роль, например, было обнаружено что структура псевдоузла в теломерной РНК существенна для активности теломеразы [10].

(a) (б) (в) (г) Рис. 1.2 Клеверная структура РНК (a) и псевдоузел (б);

(в) и (г) — арочное представление (а) и (б), соответственно.

Задача предсказания вторичной структуры РНК достаточно сложна. Вторичная структура может содержать различные элементы, отличающиеся как по энергети ческому вкладу в общую энергию биополимера, так и по энтропийному вкла ду (Рис. 1.3) [11–14].

(а) (б) Рис. 1.3 (а) — 3D структура транспортной РНК дрожжей, полученная рентгеноструктурным анализом [15];

(б) — элементы клеверной структуры РНК [16].

1.2 Методы предсказания структуры РНК Наибольшую популярность приобрели методы предсказания вторичной структуры РНК, основанные на минимизации свободной энергии [11–13, 17, 18]. Основоположни ками данного метода можно назвать М. Зукера и П. Стиглера [11]. В основе подхода лежит идея о том, что «правильная» вторичная структура РНК должна быть термодина мически наиболее стабильной и, следовательно, обладать наименьшей свободной энер гией. При решении задачи минимизации энергии необходимы правила подсчета энергии для любой структуры и эффективный алгоритм минимизации энергии. На основе разно образных экспериментальных данных [13] сделано много попыток построения правил подсчета свободной энергии и созданы достаточно эффективные алгоритмы, основан ные на динамическом программировании [19]. Основное уравнение на статистическую сумму вторичной структуры РНК (Рис. 1.2 (а)) записывается как:

+,+ = +1,+ +, +1,1 +1,+, (1.1) =+ где, описывает статистический вес участка цепи с по мономер, а, опреде ляется больцмановским весом контакта между и мономерами. Основное состояние определяется как:, = ln,, где и — константа Больцмана и абсолют ная температура, соответственно. Так как энергия комплементарной связи превышает в десятки раз при комнатной температуре (Табл. 1.1), очень часто используют так называемое приближение нулевой температуры. В таком приближении, основное со стояние определяется энергией взаимодействующих мономеров, тогда как, энтропией цепи можно пренебречь. Отметим, что выражение (1.1) может быть дополнено различ ными факторами, такими как минимальная длина петли, энергия стэкинга, различная энтропия структурных элементов РНК (Рис. 1.3 (б)). Особым случаем является пред сказание пседвоузлов [20, 21], для которых разрабатываются отдельные алгоритмы с использованием динамического программирования. Методы, основанные на миними зации энергии, на сегодняшний день — наиболее часто используемые. Но, к сожалению, эти алгоритмы не являются надежными, и их точность сильно падает при увеличении длины последовательности. Также следует отметить, что в настоящее время еще не разработан подход, количественно оценивающий вероятность ошибочного предсказа ния РНК структуры.

Один из недавно предложенных подходов основан на анализе кинетики сворачива ния РНК в процессе ее синтеза [22]. При этом, в отличие от методов минимизации свободной энергии, ищутся не наиболее стабильные структуры, а структуры, кинети чески доступные для сворачивания. Для этих подходов пока не проводилось массового анализа, однако, несмотря на физическую ясность подхода, этот метод содержит в себе довольно много неучтенных факторов.

Наконец, есть так называемый «биологический» подход, основанный на идее, что биологически важные вторичные структуры должны сохраняться в процессе эволю ции [23]. При таком подходе анализируется не одна последовательность, а множество последовательностей, выполняющих одну биологическую функцию. Однако при ана лизе множества полимеров часто используют алгоритмы минимизации энергии, что влечет за собой ошибки.

Есть ряд других алгоритмов поиска оптимальной структуры, использующих методы стохастической оптимизации, в частности, генетические алгоритмы.

Таким образом, предсказание вторичной структуры молекулы РНК по ее первичной — все еще открытый вопрос и исследования в этой области продолжаются [24–27].

Особое место среди таких задач занимают задачи о связывании РНК с биополимерами (белки, ДНК, РНК). Роль таких биополимеров как ДНК и РНК в механизмах клеточной регуляции общеизвестна. Их взаимодействие является одним из необходимых этапов клеточного цикла, связанного с хранением и передачей генетической информации. По мимо общеизвестных механизмов трансляции и транскрипции информации, основан ных на ДНК–РНК связывании, исключительно важную роль играют РНК–РНК взаи модействия. Эти взаимодействия имеют ключевое значение для регуляции экспрессии генов [28, 29]. Молекулы РНК, посредством образования комплементарных пар, связы ваются с матричной РНК или ее участком и, тем самым, останавливают трансляцию генов с данной мРНК [28]. Молекулы РНК, участвующие в процессах данного типа, называются некодирующими РНК (нкРНК). Это название обусловлено тем, что они са ми не транслируются в белки [29] и, следовательно, исключены из непосредственного процесса транскрипции.

Важная биологическая роль РНК–РНК взаимодействий обуславливает необходи мость построения эффективного алгоритма, который бы позволил по первичным струк турам молекул РНК, теоретически вычислять энергию связывания, а также предсказы вать вторичную структуру такого комплекса. Эта задача тесно связана с проблемой вы равнивания (alignment) двух произвольных линейных последовательностей типа ДНК.

Существенным отличием задачи выравнивания молекул РНК от аналогичной задачи для ДНК является наличие нетривиальной вторичной структуры у молекул РНК (Рис. 1.3).

Существует ряд подходов к определению энергии РНК-РНК взаимодействия [30–34].

Однако все они применимы в своем, достаточно узком семействе РНК последователь ностей и «хорошо» работают только на конкретных примерах. Проблемы определения энергии РНК-РНК связывания аналогичны проблемам, возникающим в задачах пред сказания вторичной структуры РНК, и эффективность того или иного алгоритма зависит от выбора факторов, которыми можно и нельзя пренебречь.

Конечно, ограничения того или иного метода могут оказаться существенными для предсказания структуры конкретной молекулы РНК, что, в свою очередь, может при вести к неверным выводам о ее функции. Однако, для исследования статистических свойств случайных последовательностей РНК, т.е. цепочек со случайной первичной структурой, достаточно учесть основополагающие свойства полимера, — для РНК, это, в первую очередь, иерархическая вторичная структура типа клеверного листа, образую щаяся согласно комплементарности азотистых оснований, и пренебречь теми, которые влияют, в большей степени, на структуру (и функцию) конкретной молекулы — псевдо узлами, минимальной длиной петли, стэкинг-взаимодействием.

1.3 Случайная первичная структура РНК Данная работа посвящена исследованию последовательностей со случайной первич ной структурой. Известно, что биомакромолекулы являются «слабо отредактированны ми случайными гетерополимерами» [1, 2]. Более того, для ряда задач распределение мономерных звеньев в первичной структуре, например, функциональных РНК мож но считать случайным [3,4]. Модель случайной первичной структуры является базовой моделью, описывающей основной (нулевой) вклад в наблюдаемые физические явления.

В работе рассматриваются статистические особенности вторичных структур длин ных (от 1000 мономеров) случайных РНК последовательностей. Такие исследования играют важную роль, например, в понимании того, насколько «близки» или «далеки»

случайные РНК от реальных [35], какие свойства биополимера наиболее существенны для выполнения им определенной функции и, в конце концов, могли ли возникнуть функциональные РНК из случайных в ходе эволюции [36]. Случайные РНК представ ляют также довольно «удобную» систему для изучения термодинамических свойств реальных молекул. Исследование фазовых переходов [37–39], ответа цепочки на внеш нюю силу [40, 41] основаны на модели случайной первичной структуры биополимера.

Существенным преимуществом этой модели является возможность охарактеризовать систему не только численно, но и аналитически.

Остановимся на двух, важных для дальнейшего рассмотрения, задачах в области статистической физики случайных РНК: термодинамических особенностях случайных РНК и описании вторичной структуры РНК случайными матрицами.

1.4 Термодинамические свойства В рамках модели случайной РНК последовательности были сделаны важные шаги в исследовании термодинамических свойств молекул РНК. Данные исследования важны не только для предсказания структуры и функции биополимеров, но также обшир но используются для разработки методов скрининга экспериментальных данных для выявления генетических маркеров заболевания [42], секвенирования одиночных нук леотидных полиморфизмов, выбора оптимальных условий для экспериментов по ги бридизации и клонированию [43, 44]. Кроме того, разработка ДНК-чипов для быстрого скрининга и секвенирования основана на способности предсказывать термодинамиче скую устойчивость комплексов, образованных олигонуклеотидными зондами [45, 46].

С пионерских работ Бундшу и Хва [37,38], несколько авторов занимались исследова ниями термодинамических свойств случайных РНК [39,47–49]. К настоящему времени, принято считать, что в этой системе имеет место фазовый переход в «замороженное»

состояние при низких температурах. Основываясь на репличном анализе, Лассиг и Ви зе, [50] и Давид и Визе [51] сформулировали задачу о переходе в терминах теории поля. Ниже приводятся доводы Бундшу и Хва, доказывающие существование фазового перехода и обсуждаются характерные свойства разных фаз.

В зависимости от температуры, случайная РНК находится в одной из фаз: i) «рас плавленная» высокотемпературная фаза (molten phase) или ii) «замороженная» низко температурная фаза (glass phase). В высокотемпературной фазе большую роль играет энтропия цепочки, нежели порядок мономеров в первичной структуре. Данная фаза хорошо описывается в модели гомополимера, комплементарное связывание не играет роли, и эффективно можно заменить все мономеры мономерами одного типа. Низко температурная фаза, наоборот, определяется, в первую очередь, первичной структурой цепочки, то есть, основной вклад в свободную энергию обусловлен комплементарным связыванием мономеров. Такую фазу принято характеризовать замороженным беспо рядком [37, 38]. Температура, при которой РНК переходит из одной фазы в другую, называется температурой фазового перехода и в литературе обозначается.

Был предложен следующий подход к определению температуры фазового перехо да. Рассмотрим пару мономеров, чье взаимодействие приводит к образованию петли наибольшего размера, т.е. нуклеотидов с номером 1 и /2 по цепи для последова тельности длиной (Рис. 1.4(а)). Определим энергию выигрыша данного контакта, которая определяется как () = ln 1,/2, где 1,/2 — вероятность связывания 1 и /2 мономера цепи. Данную энергию называют энергией пинча, и из выражения для статистической суммы цепочки (1.1), легко видеть, что:

() = 1, (1,/2 + /2+1, ). (1.2) Вероятность образования контакта между мономерами в высокотемпературной фазе 3 (/2) 2 (/2) зависит только от расстояния между ними, поэтому 1,/2 =. Энергия пинча, таким образом, () ln (1.3) линейно зависит от температуры. Температура, при которой нарушается линейная за висимость (), и есть температура фазового перехода. В численном моделировании температуру перехода обычно определяют следующим образом. Зависимость () от длины случайной последовательности РНК аппроксимируют прямой () = ( ) ln + ( ), (1.4) и строят зависимость угла наклона ( ). В высокотемпературной фазе с хорошой точ ностью ( ) = 3 (Рис. 1.5). В низкотемпературной фазе, в отличие от высокотемпе (a) (б) (в) Рис. 1.4 Вычисление энергии пинча: разделение цепочки на две половинки ограничивает число возможных конфигураций (a). Полностью комплементарные участки, один из которых лежит между 1 и /2, а второй — между (/2 + 1) и (б) могут быть найдены почти для любой случайной РНК. Комплементарное связывание ограничивает возможные конфигурации (в). Молекула разделяется на две петли, в каждой из которых образование связей происходит независимо [38].

ратурной, выигрыш зависит, в первую очередь, от первичного беспорядка (структуры) последовательности (Рис. 1.4(б,в)). Разрыв контакта между 1 и /2 мономером опре деляется не столько энтропийным фактором — насколько близки или далеки данные мономеры, а скорее энергетическими, т.е. средней энергией на мономер, числом несвя занных мономеров в цепочке. Зависимость наклона ( ) = 2 нарушается (Рис. 1.5).

Низкотемпературная фаза характеризуется линейным ростом энергии пинча с уменьше нием температуры. Точка пересечения двух прямых определяет температуру фазового перехода. В работе [48] было высказано предположение о том, что в низкотем пературной фазе, энергия пинча зависит от логарифма длины не линейным образом (Рис. 1.5), а квадратично.

Переход между расплавленной и замороженной фазой относится к непрерывным переходам второго рода [50]. Было показано, что температура перехода непосред Рис. 1.5 Зависимость наклона ( ) уравнения (1.4) от температуры для случайной последовательности РНК [38]. Температура представлена в единицах энергии комплементарной пары.

ственно связана со средним количеством несвязанных мономеров в основном состо янии [38]. Аналитическая оценка температуры перехода на порядок отличается от экспериментально полученной [38].

Высокотемпературная и низкотемпературная фазы обладают разными скейлинговы ми свойствами. Одна из величин, которая представляет интерес, — характерный размер структуры РНК. Под характерным размером понимают высоту соответствующей диа граммы в арочном представлении (Рис. 1.6) Было показано численно [38] и затем под тверждено аналитически [51], что низкотемпературная фаза характеризуется степенной зависимостью от длины последовательности, (1.5) со степенью 0.64, что близко к 0 = 2/3, и указывает на класс универсальности Кардара-Паризи-Жанга [52], характерного для таких процессов как, например, рост поверхности и баллистическая депозиция [53]. В высокотемпературной фазе числен ный эксперимент дает степень 0.54 [38], что находится в согласии с ожидаемой величиной 0 = 1/2, характеризующей размер клубка случайного полимера [2]. Сто (a) (b) Рис. 1.6 Характерный размер структуры РНК в арочном представлении (а). Размер структуры определяется количеством пар, которые нужно разбить в максимально возможной петле (б) [37].

ит отметить, что значительную роль в исследовании скейлинговых свойст случайной РНК сыграл матричный подход к описанию структуры. Построенная полевая теория перехода позволила также говорить о том, что переход происходит через образования зародышей в расплавленной фазе [50]. В следующем разделе подробно представлены основные положения описания структуры РНК случайными матрицами.

1.5 Описание РНК структур случайными матрицами Для простоты предположим, что случайный полимер обладает бесконечной гибко стью, таким образом, можно пренебречь стерическими ограничениями и говорить, что любые парные взаимодействия в цепочке возможны [54]. Статистическая сумма такой последовательности длиной в этом случае может быть представлена в виде:

= 1 +, +,, +,, +..., (1.6) где, = (, / ) обозначает статистический вес контакта (, ) с соответствую щей энергией, ;

обозначает все пары, — четверки и т.д. Суммирование ведется по все возможным контактам в цепи. Как было пока зано в [55], каждый член соответствует своей арочной диаграмме (Рис.

1.2). В этом представлении нуклеотиды — это точки, ориентированные на горизонтальной оси в направлении от 5‘ к 3‘ концу молекулы и каждая комплементарная пара — арка между взаимодействующими основаниями. Диаграммы, состоящие из непересекающихся арок называют планарными. Такие диаграммы соответствуют кактусообразным структурам РНК. Структуры типа псевдоузлов в диаграммном представлении, как уже упомина лось, соответствуют пересечению арок. Основная идея матричного анализа структур РНК заключается в следующем [55]. Рассмотрим интеграл по случайным матрицам 1 1 ) ( ), ( (, ) = (1 + ). (1.7), ( ) = = Здесь, где пробегает значения от = 1 до =, обозначает -ую случайную эрмитову матрицу, размера и (1 + ) — упорядоченное произведение таких = матриц: (1 + 1 )(1 + 2 )...(1 + ). Нормировочный множитель 1 ) ( ) 2, ( ( ) =, (1.8), = и — симметричная матрица с элементами,. Интеграл 1.7 можно оценить ис пользуя теорему Вика. В результате, для больших интеграл (1.7) можно представить, как ( ) = 1 +, +,, +,, +... (1.9) Взаимосвязь полученной функции со статистической суммой (1.6) очевидна. При = функции совпадают, для 1 слагаемые (1.9) содержат информацию о топологии кон фигураций. Все планарные диаграммы описываются членом (1) (1.9), более высокие порядки разложения 1/ 2 соответствуют структурам РНК с псевдоузлами. Классифика ция псевдоузлов, возникающая из выражения (1.9) описана в [56]. В общем случае для конкретной последовательности РНК, описываемой матрицей с элементами,, задача определения всех возможных конфигураций оказывается очень сложной. Для точно го описания топологии вторичных структур РНК пользуются рядом упрощений. Так, предположение, что все элементы матрицы, равны между собой, =, позволяет вывести общую формулу для статистической суммы, причем каждое слагаемое несет информацию и о топологии структуры и о количестве контактов в ней (Табл. 1.2). В этом случае, многомерный интеграл (1.7) может быть сведен преобразованиями Хаббарда Стратоновича к одномерному, включающему спектральную плотность гауссовой мат рицы [57]. Так как выражение для спектральной плотности хорошо известно из теории случайных матриц [58], интеграл (1.7) можно вычислить точно. Так, для четырехбук венной последовательности статистическая сумма 4 ( ) = 1 + 6 + 2 2 + 2 / 2, а соответствующие разрешенные конфигурации представлены на Рис. 1.7.

Рис. 1.7 Возможные конфигурации для четырехбуквенной последовательности.

1/ 2 –разложение статистической суммы ( ) можно представить /, ( ) =, (1.10) = где, описывает количество конфигураций определенного типа ( = 0 — планарные диаграммы, = 1 — конфигурации с одним псевдоузлом) c арками (Рис. 1.7).

Разложение ( ) по степеням большим чем 1/ 2 описывает конфигурации со сложными псевдоузлами. Теория таких структур описана в [60].

( ) 1 2 1 + 3 1 + 1 + 6 + 2 2 + 2 / 1 + 10 + 10 2 + 5 2 / 1 + 15 + 30 2 + 5 3 + (15 2 + 10 3 )/ 1 + 21 + 70 2 + 35 3 + (35 2 + 70 3 )/ 1 + 28 + 140 2 + 140 3 + 14 4 + (70 2 + 280 3 + 70 4 )/ 2 + 21 4 / Таблица 1.2 Разложение статистической суммы (1.7) по степеням 1/ 2 для разных длин полимера [59].

Глава Алгоритмы вычисления свободной энергии РНК-подобных структур Данная глава посвящена разработанным алгоритмах описания вторичной структуры биополимеров и вычисления их свободной энергии.

Сначала рассматривается задача о так называемом выравнивании двух последова тельностей и приводится стандартный алгоритм динамического программирования, ис пользуемый для определения оптимальной конфигурации в такой задаче. Затем показы вается, что задача о выравнивании последовательностей может быть представлена как задача о вычислении свободной энергии основного состояния (т.е. при 0) стати стической модели, описывающей комплексообразование двух линейных сополимеров.

Далее, учитывая способность каждого из сополимеров образовывать РНК-подобную структуру с иерархией петлевых участков, выводится выражение для статистической суммы такого двунитевого комплекса. Рассматривается алгоритм определения энергии основного состояния такого РНК-подобного комплекса и соответствующий подход к описанию его структуры.

2.1 Выравнивание последовательностей Задача о выравнивании двух последовательностей – это задача нахождения эффек тивного алгоритма поиска наибольшей общей подпоследовательности (НОП) двух про извольных линейных последовательностей. Данная проблема является одной из ключе вых задач вычислительной эволюционной биологии. В частности, она позволяет судить о том насколько далеко (в эволюционном смысле) разошлись друг от друга два рассмат риваемых гена и какие гены могут являться их общими предками [61, 62]. Задача об НОП широко исследовалась в биологии [63–65], компьютерных науках [66–69], теории вероятности [70–75] и позже в статистической физике [37, 76–78].

Задача о поиске НОП двух последовательностей формулируется следующим обра зом. Рассмотрим две произвольные последовательности (в качестве примера рассматри ваются последовательности РНК, составленные из 4-х буквенного алфавита A, C, G, U):

1 = {A, C, G, C, U, A, C} длины = 7 и 2 = {C, U, G, A, C} длины = 5. Далее, везде под алфавитом подрузамевается количество различных мономерных хвеньев в первич ной структуре. Общая подпоследовательность – это подпоследовательность, содержа щая буквы (нуклеотиды) как первой, так и второй последовательности, причем под последовательность необязательно содержит буквы, идущие непосредственно друг за другом. Так, например, для двух последовательностей 1 и 2 можно выделить несколь ко различных общих подпоследовательностей, например, {C, U, A, C} или {G, A, C} – обе эти подпоследоавтельности содержатся в 1 и 2, и являются для них общими.

Число возможных общих подпоследовательностей с ростом длин и полимеров растет экспоненциально. Алгоритм для определения оптимального выравнивания двух последовательностей впервые был сформулирован в [79]. В наиболее общем смысле каждое выравнивание двух последовательностей характеризуется числом совпадающих и несовпадающих букв и числом пропусков (делеций) в выравненных последователь ностях. Для каждого выравнивания можно ввести весовую функцию (cost function), имеющую значение энергии [79, 80]:

= match + mis + gap. (2.1) В формуле (2.1) match, mis и gap – число пар совпадающих букв, число пар несов падающих букв и число делеций в рассматриваемом выравнивании, соответственно.

Величины и – это вклады в весовую функцию от пары несовпадающих букв и делеции;

вклад от пары совпадающих нуклеотидов, без потери общности, можно счи тать равным 1. В таком представлении функция удовлетворяет очевидному закону сохранения:

+ = 2match + 2mis + gap. (2.2) Используя (2.2), формулу (2.1) можно переписать в виде:

= match + mis, (2.3) где =. (2.4) 1 Здесь интерес представляет область 0 1, так как, случай 0 неотличим от = 0, а случай 1 соответствует тому, что «несовпадения» более выгодны, чем «совпадения» и может быть учтен простым переопределением этих понятий. Заметим, что, хотя предлагаемая теория применима ко всему доступному интервалу значений, все численные результаты настоящей работы получены для случая = 0, который представляется наиболее физически осмысленным. Задача поиска НОП заключается в определении выравнивания с максимальным значением весовой функции.

Оказывается, что для нахождения весовой функции удобнее всего использовать рекурсивный алгоритм, известный как метод динамического программирования:

[ ] max max max max, = max 1,,,1, 1,1 +,, (2.5) где 1, для 1 () = 2 (), = (2.6) для 1 () = 2 ().

, Выражения (2.5)—(2.6) имеют следующий смысл. Начиная с левых концов после довательностей, на каждом шаге выбирается такое положение букв в выравнивании, которое вносит наибольший вклад в функцию. Члены в (2.5) соответствуют трем воз можным ситуациям: пропуску буквы в первой последовательности, пропуску во второй последовательности и случаю, когда -ая буква первой последовательности выравнена с -ой буквой второй последовательности.

2.2 Комплементарное связывание биополимеров Цель работы заключается в разработке статистического алгоритма вычисления весо вой функции, которая бы характеризовала «похожесть» двух заданных последователь ностей со сложной вторичной структурой типа РНК. Эта функция должна включать как энергетический вклад от непосредственного взаимодействия мономеров друг с дру гом, так и энтропийный вклад, обусловленный наличием ансамбля пространственных конформаций макромолекул. При этом постараемся, по возможности, остаться в рам ках статистической физики и избежать неконтролируемых эвристических соображений, апеллирующих к опыту, полученному в результате анализа экспериментальных данных.

Прежде всего покажем, что рекуррентное соотношение (2.5) имеет прозрачный фи зический смысл в терминах статистической физики и формулы (2.5), (2.6) можно рас сматривать как свободную энергию статистической модели, описывающей комплексо образование двух взаимодействующих линейных полимеров в пределе нулевой тем пературы. Затем, учитывая возможность того, что каждый из полимеров может, поми мо собственно компексообразования, образовывать сложную иерархическую структуру, обобщим выражение для статистической суммы (соответствующей ненулевой темпе ратуре) на комплексы с внутренней иерархической структурой. Переходя в конечном выражении снова к пределу 0, найдем искомую весовую функцию.

Рассмотрим вспомогательную статистическую модель, описывающую взаимодей ствие двух линейных полимеров с произвольными первичными последовательностями.

Пусть длины этих последовательностей, измеренные в единицах мономерных звеньев, равны и, соответственно. Каждый мономер может быть выбран из различных мономеров,,,,... (Для последовательностей РНК = 4). Мономеры первой по следовательности могут образовывать связи с мономерами второй последовательности.

В молекулах РНК такие связи образуются согласно комплементарности азотистых ос нований (1.1). Будем считать энергию связи между комплементарными нуклеотидами равной, а энергию между некомплементарными равной, где и — некото рые положительные величины (|| ||). Предположим также, что некоторые части полимеров могут образовывать петли. На Рис. 2.1 схематически представлено взаимо действие двухбуквенных полимеров. Очевидно, что петли соответствуют делециям в задаче о выравнивании двух последовательностей.

Задача заключается в вычислении свободной энергии описанной модели при доста точно низких температурах, при которых энтропийным вкладом можно пренебречь по сравнению с энергетическим. Пусть, – статистическая сумма рассматриваемого комплекса. По смыслу, – это сумма по всем возможным конфигурациям связей.

Рис. 2.1 Взаимодействие мономерных звеньев в РНК-подобной структуре с петлевыми участками как выравнивание соответствующих последовательностей (первичных структур).

При низких температурах, можно представить как:

,, = 1 +, 1, (2.7),= = 1;

= 1;

= 1.

,0 0, 0, Смысл данной формулы очевиден: начиная с левого конца последовательно стей (Рис. 2.1), находим первый существующий контакт между -м мономером первой цепи и -м мономером второй, а далее суммируем по всем возможным расположениям этого контакта. Статистические веса связей, определяются энергией контакта между -ым и -ым мономерами:

+ /, 1 () и 2 () комплементарны, = (2.8) /, 1 () и 2 () не комплементарны.

Здесь и далее,. Легко проверить, что статистическая сумма вида (2.7) удовле творяет рекуррентному соотношению:

, = 1, +,1 + (, 1) 1,1. (2.9) В свою очередь, статистическая сумма связана со свободной энергией комплекса, и температурой известным соотношением, = exp{, / }. Будем интере соваться значением свободной энергии с точностью до знака, тогда для величины, =,, переходя в уравнении (2.9) к пределу 0, получим:

( ), = lim ln 1, / +,1 / + (, 1) 1,1 /. (2.10) Формулу (2.10) можно переписать в виде:

[ ], = max 1,,,1, 1,1 +,, (2.11) где введено обозначение:

, = ln(, 1) = = ln(/ 1), если 1 () и 2 () комплементарны + (2.12) = = ln(/ 1), если 1 () и 2 () не комплементарны.

Принимая + за единицу энергии, перепишем формулу (2.11) в виде:

[ ], = max 1,,,1, 1,1 +,, (2.13) с 1, если 1 () и 2 () комплементарны, = (2.14) / 1) = = ln( =, если 1 () и 2 () не комплементарны.

+ ln(/ 1) И функция, удовлетворяет начальным условиям: 0, =,0 = 0,0 = 0. Видно, что выражение свободной энергии связывания двух полимеров без петлевых взаимодей ствий имеет вид, совпадающий с (2.5). Далее, все результаты численного моделирования = 0.

представлены для Таким образом, рекурсия, используемая в методе динамического программирования является ничем иным, как рекуррентным соотношением на свободную энергию взаи модействия гетерополимеров в пределе нулевой температуры. В природе существует множество примеров образования подобных гетерополимерных комплексов, например, образование двойной спирали ДНК.

Отметим, что предложенная выше модель является лишь первым приближением к описанию комплексообразования биополимеров. Известно (см., например, [2]), что для точного количественного описания такого связывания, например, двойной спира ли ДНК необходимо учесть еще ряд факторов. Во-первых, не учтены так называемые «петлевые факторы»: при образовании петли возможные конформации полимера огра ничены условием, что ее концы обязаны сойтись в одной точке пространства, поэтому образование каждой петли приводит к снижению энтропии комплекса. Во-вторых, в реальной ДНК имеется выраженная кооперативность образования связей: вероятность образования связи выше, если соседние мономеры также образуют связь. В-третьих, не учтено, что гибкость полимера конечна и, тем самым, существует ограничение на ми нимальную длину петли. И наконец, не было принято во внимание то обстоятельство, что комплементарные пары и имеют различную энергию связи и, что помимо комплементарных пар, возможно образование неканонических пар (см. 1.1).

Обобщение выражений (2.7)–(2.14) с учетом кооперативности образования связи, минимальной длины петли и различной энергией комплементарных связей — задача вычислительно сложная, но не требующая качественного изменения предложенного формализма, т.к. эти факторы влияют только на локальные свойства полимерных це пей. С другой стороны, петлевой фактор — характеристика нелокальная, зависящая от расстояния между мономерами, образующими связи и в этом случае нельзя опи сать состояние комплекса уравнениями динамического программирования, вида (2.7).

Однако, поскольку петлевые факторы имеют энтропийную природу, в пределе низких температур ( 0) их вклад в свободную энергию гетерополимерного комплекса становится пренебрежимо мал. Ситуация усложняется, если сами петли могут обра зовывать вторичную структуру (т.е. если внутри петли имеет место взаимодействие между мономерами), а именно такая ситуация типична для последовательностей РНК.

В этом случае энергетический вклад от вторичной структуры петли сохраняется и в пределе нулевой температуры, и его учет становится необходим.

2.3 Связывание РНК с внутрипетлевым взаимодей ствием В этом разделе обобщается модель взаимодействия двух сополимеров на случай, когда возможно комплементарное связывание внутри петель комплекса. Будем рассмат ривать иерархические структуры петель типа клеверного листа (Рис. 1.2(a)), структуры типа псевдоузлов (Рис. 1.2(б)) в данной работе не рассматриваются. Как и в предыду Рис. 2.2 Диаграмма для вычисления статистического веса последовательности.

щем параграфе для простоты не будем учитывать кооперативность образования связей и различие в энергиях комплементарных пар. Однако, как уже указывалось, модель может быть обобщена с учетом этих факторов. Согласно [41] можно переписать выра жение (2.7) для статистической суммы, двух взаимодействующих сополимеров в виде:

, (1) (2) (1) (2), = 1, 1, +, 1,1 +1, +1, (2.15),= = (1) ;

= (2) ;

= 1,,0 0, 0, 1, 1, (1) (2) где, и, обозначены статистические веса участков (с -го нуклеотида до -го) пер вой и второй последовательности, соответственно, удовлетворяющие уравнениям [81]:

1 () () (), = 1 +, +1,1 +1, ;

(2.16) = =+1+ () = 1, = 1, 2.

, Эти уравнения отвечают за топологию кактусообразной структуры, свойственной мо лекулам РНК, диаграмма, описывающая такие структуры представлена на Рис.2.2. Ко эффициенты, – это константы, описывающие взаимодействие внутри последова тельности, аналогичные,. Суммирование по ведется от + 1 + до для того чтобы исключить петли длиной меньше мономеров. В последующих вычислениях, как правило, предполагается, что =0, также обсуждается случай = 3. Напомним еще раз, что так как интерес представляет низкие температуры, можно пренебречь вкладом, связанным с потерей энтропии при образовании петель.

() Сложную систему уравнений на статистические веса петлевых участках,, = 1, 2 (2.16) можно решить следующим образом. Для каждой из последовательности РНК можно построить матрицу, (, )-й элемент которой определяет статистический вес участка, начинающейся с -го нуклеотида и заканчивающейся -м. Таким образом, ста тистические веса всех возможных петель описываются матрицами размера для первой последовательности и для второй. Из граничных условий (2.16) можно () однозначно определить элементы,+1. Из (2.16) следует, что элементы последующих () () субдиагоналей,+ зависят только от элементов предыдущих субдиагоналей,+ матрицы:

+ () () () (),+ = +1,+ +, +1,1 +1,+. (2.17) =+ Определенные таким образом матрицы статистических весов () всех возможных пе тель позволяют вычислить статистическую сумму взаимодействия двух РНК с внутри петлевым взаимодействием (2.15).

Как и в случае связывания последовательностей без петлевых участков, можно вы полнить переход к пределу нулевой температуры – см. выражения (2.7)-(2.14). Элементы матрицы свободной энергии при этом можно представить в виде:

[ ] (1) (2), = =1,..., 1, + 1,,, max (2.18), =1,..., [ ] () () где, = lim ln, ( = 1, 2) имеют смысл с точностью до знака свободных энергий петлевых участков последовательностей с -го нуклеотида по -й,, – (, ), ый элемент суммы (2.15), который в пределе нулевой температуры есть:

(1) (2), = 1,1 + +1, + +1, +,.

(2.19), Элемент, описывает энергию комплекса взаимодействующих РНК, не имеющих () контакта правее пары (, ). Из (2.17) следует, что функции, удовлетворяют:

[ ( )] () () () () (),+ = max +1,+, max +1,1 + +1,+ +,, (2.20) () здесь величина, – величина, как в (2.14),, – аналогичная величина, описываю щая взаимодействие внутри петель. На свободную энергию накладываются граничные условия, как это следует из (2.15):

= 0;

0, (1) (2.21) = 1, ;

1, = (2) ;

1.

0, 1, Таким образом, для того, чтобы вычислить энергию основного состояния комплекса двух взаимодействующих РНК, необходимо построить матрицы (1) и (2) и, далее, применяя (2.18)-(2.19), определить элементы матрицы.

Отметим, что выражения (2.17), (2.20) можно использовать для непосредственного вычисления свободной энергии основного состояния одноцепочечной РНК.

2.4 Алгоритмы восстановления структуры В данном разделе показывается, как алгоритм для вычисления энергии основного состояния может быть применен для восстановления структуры. Рассмотрим сначала комплексообразование двух линейных сополимеров.

Нахождение НОП двух линейных последовательностей В отличие от (2.13) будем теперь интересоваться, не количеством мономеров в наи большей общей подпоследовательности, а ее составом, т.е. определением, из каких мономеров состоит общая НОП. Отметим, что, вообще говоря, задача может иметь множество решений, т.е., основное состояние может быть вырождено. Алгоритм, кото рый будет описан ниже, позволяет определить все возможные НОП двух цепочек. Здесь и далее, в численном моделировании использовались параметры || = 1 и || = 0. В таком рассмотрении функция (??),(??) совпадает с количеством комплементарных связей в структуре основного состояния.


Рассмотрим действие алгоритма на конкретном примере. Возьмем две последова тельности:

C G U U C C S G C G G A A S (очевидно, что = = 6), и построим матрицу с, = 1, если –й мономер пер вой последовательности комплементарен –му мономеру второй последовательности и, = 0, в противном случае (см. Рис. 2.3(а)). Далее, строим матрицу, исполь зуя рекурсивный алгоритм (2.13)-(2.14) (см. Рис. 2.3(б)). Нижний правый элемент этой матрицы 6,6 = 4 соответствует количеству комплементарных связей в основном со стоянии комплекса. Теперь, чтобы установить, какие конкретно мономеры образуют связь, нам нужно, восстановить каждый шаг алгоритма (2.13). Вся информация содер жится в матрице. Действительно, сравним (, )–элемент матрицы с соседними ему элементами 1,1, 1,,,1 и:

1. если 1,1 = max [1,1, 1,,,1 ], тогда в оптимальном выравнивании -й нуклеотид первой последовательности связан с -м мономером второй;

2. если 1, = max [1,1, 1,,,1 ], то в оптимальном выравнивании -й нуклеотид первой цепочки не участвует в комплексообразовании и таким образом, является пропуском (петлевым мономером);

3. и, наконец, если,1 = max [1,1, 1,,,1 ], то пропуском является -й мономер второй последовательности.

В случае, когда выполняется несколько пунктов одновременно, основное состояние является вырожденным, и необходимо проследовать по всем образующимся путям в матрице. Начальной точкой всегда является элемент (, ) матрицы. Для рассмат риваемых последовательностей описанный алгоритм приводит к структурам, изобра женным на Рис. 2.3(в, г).

(б) (а) (в) (г) Рис. 2.3 Алгоритм восстановления связей при взаимодействии двух РНК с петлевыми участками: матрица возможных контактов (а) и матрица (б), построенная согласно (2.13)-(2.14);

оптимальные пути на матрице и соответствующие им оптимальные структуры (в), (г).

Структура комплекса с внутрипетлевым взаимодействием Более сложной является процедура восстановления структуры комплекса с внут рипетлевым взаимодействием. Схематически алгоритм определения контактов в опти мальной конфигурации показан на Рис. 2.4.

Рис. 2.4 Алгоритм определения оптимальной конфигурации комплементарного связывания РНК-подобных молекул с внутрипетлевым взаимодействием.

Начальным элементом, как и в задаче без петлевых участков, выбирается нижний правый элемент матрицы,. Если, 1, + 1, (см. (2.18)), то информация о контакте в оптимальной конфигурации содержится в матрице (2.19). Отметим, что каждая пара (, ) характеризуется своей матрицей. Максимальный элемент матри цы, говорит о контакте между -м мономером первой последовательности и -м нуклеотидом второй (Рис. 2.4). Далее описанная процедура повторяется. Как и в преды дущем параграфе, рассмотрим действие алгоритма на конкретном примере:

A U C U C A C S G C C A G G G S Для последовательностей 1 и 2, на Рис. 2.5 приведены соответствующие матри цы (2.20)-(2.20). Элемент 7,7 = 6 показывает, что в оптимальной конфигурации со держатся 6 комплементарных пар. Чтобы, установить какие именно мономеры обра зуют пары, согласно разработанному алгоритму, рассматриваем матрицы для по следовательно устанавливаемых контактов. Так, максимальный элемент 7,7 для 7, показывает, что 7-ой мономер 1 и 7-ой мономер 2 образуют пару. На следующем шаге рассматриваем матрицу для элемента 6,6 (2.19). Если матрица содержит несколько одинаковых максимальных элементов, это свидетельствует о вырожденности основного состояния. В данном случае процедура повторяется для каждого из элемен тов. Отдельно восстанавливается структура комплементарных связей внутри петель комплекса. Отметим, что эта задача идентична восстановлению структуры отдельной цепочки РНК. Алгоритм восстановления структуры петли основан на (2.20) и заклю чается в установлении, какая пара мономеров (, ) обеспечивает наибольший вклад в выражение для. На Рис. 2.5 приведены две возможные конфигурации рассматривае мых последовательностей 1 и 2.

(б) (а) (в) (г) (д) (е) (ж) (з) Рис. 2.5 Алгоритм определения оптимальной конфигурации связывания РНК с внутрипетлевым взаимодействием: матрицы контактов внутри последовательностей (а, б) и между ними (в);

матрицы 1 (г) и 2 (д), и (е), вычисленные по (2.18)-(2.20);

соответствующие матрицы для контактов (ж) в соответствующих оптимальных конфигурациях (з).

Разработанные алгоритмы были использованы для описания взаимодействий двух молекул РНК. На Рис. 2.6 представлены структуры получаемых комплексов. Следует отметить, что структура образующегося комплекса двух полимеров сильно зависит от деталей модели. Так, структуры (б) и (в) (Рис. 2.6) отличаются только одним параметром в модели: минимальным размером петли. Сильная чувствительность глобальной топо логии оптимальной структуры к микроскопическим деталям модели ясно показывает, что для того чтобы получать экспериментально достоверные результаты, необходимо иметь подробную информацию о точных значениях петлевого фактора, энергий свя зей и параметра кооперативности. Как уже указывалось, при необходимости все эти параметры можно учесть не выходя за рамки предложенной модели.

(а) (б) (в) Рис. 2.6 Комплементарное связывание двух РНК: с петлевыми участками (a), с внутрипетлевым взаимодействием и минимальной длиной петли = 0 (б), и = 3 (в).

Глава Свойства РНК структур со случайной последовательностью звеньев В данной главе обсуждаются свойства распределения свободной энергии основно го состояния в ансамбле РНК-подобных молекул со случайной первичной структурой.

Также, приводятся результаты для распределения длин петель в РНК-подобных струк турах и обсуждаются аналитические модели их описания.

3.1 Свободная энергия основного состояния Связывание двух РНК с петлевыми участками Задача поиска оптимальной конфигурации линейного выравнивания случайных по следовательностей неоднократно рассматривалась в литературе (см., например, [82,83]) в рамках так называемой модели «бернуллиевского сравнения», т.е. в предположении о том, что матричные элементы, (2.14) являются независимыми случайными величи нами, принимающими значения 1 с вероятностью = 1 и 0 с вероятностью = 1, где — алфавит, используемый в случайной первичной структуре полимера. В рабо те [83] было показано что для длин последовательностей, 1 распределение энергии основного состояния имеет вид:

]2/ 2 ( + ) ()1/ [, = (1 + ) + ( + ) (3.1) где – случайная величина с распределением Трейси–Видома ( = 1.7711... и 2 2 = 0.8132...)(более подробное описание этого распределения можно найти, например, в обзоре [84]). При =, оптимальная конфигурация характеризуется:

+ () 1/3,, (3.2) 1 + где 1/6 ( 1)1/ () =.

+ Флуктуации свободной энергии подчиняются: [83]:

2 2 ()1/3.

,, (3.3) Показатель 1/3 является типичным для стохастической динамики сильно коррелиро ванных систем и относится к классу универсальности Кардара-Паризи-Занга (Kardar– Parisi–Zhang (KPZ)) [52].

Результаты численного моделирования распределения свободной энергии основного состояния для ансамбля случайных первичных структур РНК представлены на Рис. 3.1.

Угловой коэффициент прямой 0.65 (Рис. 3.1(a)), что хорошо согласуется с вели, 2, вычисленной по формуле (3.2). Для флуктуации энергии чиной = lim полученный наклон 0.34 (Рис.3.1(б)) также близок к значению 1. Таким образом, урав нение (3.2), полученное в приближении бернуллиевского сравнения, удовлетворительно описывает численно наблюдаемую зависимость энергии основного состояния при свя зывании сополимеров с петлевыми участками от длины случайных цепей.

Связывание двух РНК с внутрипетлевым взаимодействием Аналогичный анализ был проведен и для двух последовательностей, образующих структуру с внутрипетлевым взаимодействием и минимальной длиной петли = 0. Со ответствующие графики зависимости свободной энергии и флуктуации энергии пред ставлены на Рис. 3.2. Как и для взаимодействия с петлевыми участками,, () = при 1 (Рис. 3.2), но угловой коэффициент прямой 0.92 гораздо выше, что обусловлено взаимодействием нуклеотидов внутри петель. Зависимость флуктуации энергии основного состояния остается такой же (см. Рис. 3.2(б)).

(а) (б) Рис. 3.1 Взаимодействие РНК с петлевыми участками: зависимость среднего значения свободной энергии основного состояния, (а) и флуктуации энергии (б) от длины случайной последовательности. Усреднение проводилось по ансамблю из случайных пар последовательностей для каждого значения длины.

(а) (б) Рис. 3.2 Связывание РНК с внутрипетлевым взаимодействием: зависимость энергии основного состояния, (а) и флуктуации свободной энергии (б) от длины случайной последовательности. Усреднение проводилось по ансамблю из случайных пар последовательностей для каждого значения длины.

Рис. 3.3 Иерархическая модель связывания двух полимеров с внутрипетлевым взаимодействием. Петли первого ( = 1), второго ( = 2) и третьего ( = 3) иерархических уровней.

Оценим аналитически величину коэффициента в зависимости свободной энергии от длины цепи для внутрипетлевого взаимодействия (Рис. 3.2). Будем рассматривать комплекс, который образуют две случайные последовательности РНК, как структуру, состоящую из петель различных иерархических уровней, занумерованных индексом (см. Рис. 3.3).

Каждую петлю -ого иерархического уровня можно рассматривать как комплекс двух взаимодействующих подпоследовательностей из которых она состоит. Из выражения (3.1) следует, что наибольший вклад в свободную энергию наблюдается для комплекса, состоящего из двух последовательностей равной длины, =. Это позволяет оценить сверху свободную энергию петли как свободную энергию двух взаимодействующих по ловинок этой петли. Представление комплекса двух молекул РНК в виде иерархической структуры позволяет использовать идеи ренормализационной группы [85]. А именно, комплексы -ого иерархического уровня содержат петли, которые будем считать ком плексами ( + 1)-ого уровня (Рис.3.3) ( = 1, 2,...).


Формализуя эту идею, будем полагать, что комплекс двух молекул РНК иерархи ческого уровня – это комплекс двух последовательностей с петлевыми участками, в которых энергия взаимодействующих мономеров перенормирована энергией петель иерархического уровня (+1). Пользуясь тем, что энергия петель в первом приближении () () пропорциональна длине (3.2), представим ее в виде:, где — длина петли, а — соответствующий -ому уровню коэффициент связывания. Подставляя в формулу (2.15) статистические веса петель,+ = /, получим выражение для определения свободной энергии комплекса двух случайных РНК–последовательностей 1 :

(+1) () () [ ], = max 1, +,,1 +, (1,1 + )(, ). (3.4) Выражение (3.4) нужно понимать следующим образом. Прежде всего, определим сво (2) бодную энергию комплекса,, в котором могут образовываться петли только первого иерархического уровня. Далее определим энергию связывания на один мономер в пет лях второго уровня как (2), (2) =. (3.5) + Подставляя полученный коэффициент связывания снова в формулу (3.4), получим (3) значения энергии для петель третьего иерархического уровня,, и т.д. Величина (, ) учитывает ограничение на минимальное количество мономеров, которые мо гут образовать петлю -ого иерархического уровня:

1 мономеры и могут образовать связь (, ) = (3.6) 0 в противном случае Будем считать, что -й и -й мономеры могут образовать связь, если:

а) участок [, 1] последовательности 1 не имеет связей с участком [, 1] подпоследовательности 2, где – минимальное количество нуклеотидов, необходимых для формирования петли определенного уровня (если и/или, то рассматриваются соответственно участки последовательностей [1, ] и/или по [1, ]);

б) 1-й мономер первой последовательности взаимодействует с 1-м мономером второй последовательности, и при замене ( 1), ( 1) выполняется а) (или б)).

В таблице 3.1 приведены значения для коэффициента связывания и минимальное ко личество нуклеотидов в петлях -ого уровня;

вычисления проводились для случайных последовательностей равной длины = = 104. Длины последовательностей слабо Здесь, как и ранее, имеет смысл свободной энергии с обратным знаком влияют на средний коэффициент связывания, однако рассмотрение больших длин поз воляет провести оценку для большего количества иерархических уровней. Отметим, что коэффициент связывания, определяемый по данной иерархической процедуре, медлен но (логарифмически) стремится к 1 с ростом количества иерархических уровней (т.е.

при ). Логарифмическая зависимость обусловлена экспоненциальным ростом минимального числа мономеров, которые могут образовать петлю, = 3 + ( 2) с увеличением номера иерархического уровня ( см. Табл. 3.1).

Таким образом, численно наблюдаемый коэффициент связывания (Рис. 3.2(а)) в действительности зависит от длин рассматриваемых последовательностей и получен ное нами значение 0.92 лишь указывает на то, что последовательности длиной 400 1000 мономеров образуют структуру всего с двумя–тремя иерархическими уров нями.

Уровень, 2 3 4 5 6 2 6 24 78 240 Минимальная длина петли 0.851 0.912 0.931 0.937 0.94 0. Коэффициент связывания Таблица 3.1 Вероятность связывания мономеров в зависимости от числа уровней в иерархической модели взаимодействия двух полимеров.

3.2 Распределение длин петель в РНК-подобных струк турах Связывание двух РНК с петлевыми участками Было проанализировано распределение длин петель в структуре комплекса с петле выми участками и внутрипетлевым взаимодействием. На Рис. 3.4 представлена зави симость () числа петель различной длины для структуры с петлевыми участками.

Видно, что зависимость с хорошей точностью является экспоненциальной. Такое рас пределение характерно для системы, в которой связывание различных мономеров в цепи происходит независимо (т.е. вероятность того, что следующий по цепи мономер образует связь, никак не зависит от того, образует ли связь предыдущий мономер).

, при 1 можно рассматривать, как вероятность Действительно, величину = связывания мономера в структуре. Считая, что взаимодействие мономеров независи мым, число петель длиной в структуре двух взаимодействующих сополимеров длиной можно оценить, как:

() = 2 (1 ). (3.7) Такое распределение длин петель при 1 удовлетворяет очевидному соотношению =1 () = (1). Из Рис. 3.4 видно, что численные результаты хорошо аппрокси мируются в логарифмическом масштабе прямой () =, где c хорошей точностью ln( 2 ) и ln(1 ) (см. (3.7)). Таким образом, в связывании сополимеров с петлевыми участками статистика петель выглядит в точности так, как происходит при независимом связывании мономеров. Однако стоит отметить, что модель независимого связывания дает хорошие результаты для последовательностей, в которых количество различных сортов мономеров 4. Для двухбуквенных и трехбуквенных алфавитов, взаимодействие сополимеров оказывается коррелированным, и формула (3.1) плохо описывает энергию оптимальной конфигурации.

Связывание двух РНК с внутрипетлевым взаимодействием Существенно иное поведение имеет статистика петель в комплексах с внутрипет левым взаимодействием. На Рис.3.5(а) представлена зависимость числа петель с дли ной по набору из 103 пар случайных последовательностей. Отметим особенности наблюдаемого распределения. Во-первых, для данной зависимости характерно степен ное поведение. Показатель степенной зависимости для РНК разной длины меняется в интервале [1.38, 1.5]. Во-вторых, распределения для РНК с различной длиной совпа дают, что позволяет проводить вычисления для набора коротких последовательностей.

В-третьих, при малых ( 5) характерно небольшое число петель с нечетной дли ной и большое число петель с четной длиной. Последнее обстоятельство связано с тем, что для структуры комплекса с внутрипетлевым взаимодействием и = 0 характер но высокое значение средней энергии на один нуклеотид ( 0.92), обусловленное связыванием внутри петель, а образование петли малой длины с нечетным числом Рис. 3.4 Распределение длин петель в структуре комплекса с петлевыми участками.

Вычисления были выполнены для случайных последовательностей длины = 104, результаты усреднялись по набору из 105 сополимеров.

нуклеотидов приводит к потере, по крайней мере, одной возможной связи внутри пет ли. Таким образом, образование петель с нечетным числом мономеров энергетически невыгодно. Наконец, для распределения характерно наличие плато при больших, что обусловлено эффектом конечного размера (см., например, [86], где построена теория аналогичного эффекта).

Полученные численные распределения можно интерпретировать следующим обра зом. Поставим каждой вторичной структуре полимера в соответствие одномерное слу чайное блуждание на (1+1)-мерной решетке, построенное следующим образом (см.

Рис. 3.6). Каждому мономерному звену соответствует один шаг блуждания. Этот шаг направлен направо вверх, если мономер является «началом петли» (т.е. связан с моно мером, расположенным после него по цепи), направо вниз, если он является «концом петли» (т.е. связан с мономером, расположенным до него по цепи) или горизонтально, если мономер не образует связи. Легко видеть, что такое построение задает соответ ствие между РНК-подобными вторичными структурами и так называемыми путями Моцкина [87] — состоящими из горизонтальных и диагональных участков дискретны ми случайными блужданиями в верхней полуплоскости, концы которых закреплены Рис. 3.5 (a) Распределение длин петель в структуре комплекса с внутрипетлевым взаимодействием. Вычисления проводились для последовательностей с длинами = = 75, 100 и 200, для каждого было выполнено 103 накоплений, для функция распределения сглаживалась по 10 соседним значениям);

(б) Распределение путей Моцкина по длинам (длина пути случайного блуждания 200 шагов, количество накоплений -104, для 30 функция распределения сглаживалась по 10 соседним значениям).

на оси абсцисс. Возвращение на ось абсцисс соответствует образованию одной пет ли в структуре комплекса. Как известно, [88], количество различных путей Моцкина (, ) длины с заданным количеством горизонтальных шагов определяется чис лами Каталана:

(, ) = ()/2 =, (3.8) +1 2 – биномиальные коэффициенты, ()/2 – числа Каталана. При где (3.8) имеет асимптотическую зависимость (, ) 3/2 от длины пути. Было по строено распределение длин петель для случайных путей Моцкина с вероятностью диагонального шага вверх или вниз равной = 0.46, где = 0.92 — наблюдаемое в численном моделировании значение вероятности образования связи, а вероятность горизонтального шага 1 2. Результат приведен на рисунке 3.5(б). Видно, что зави симость обладает всеми характерными свойствами, наблюдаемыми для распределения длин петель в структуре с внутрипетлевыми взаимодействиями.

Рис. 3.6 Вторичная структура РНК с пропусками и соответствующий ей путь Моцкина (а);

Полностью связанная структура РНК без пропусков и соответствующий ей путь Дика (б).

Представление структур РНК в виде путей Моцкина, статистика которых известна, позволяет сделать интересное наблюдение. А именно, показать, что для РНК-подобных структур характерно критическая зависимость структуры основного состояния в зави симости от числа различных сортов мономеров, используемых в последовательности.

Глава Топология РНК-подобных молекул в зависимости от алфавита случайной первичной структуры Данная глава посвящена исследованию топологии пространственной структуры РНК-подобной молекулы в основном состоянии и ее изменений в зависимости от ал фавита, используемого в случайной первичной структуре. А именно, показывается, что существует некоторая критическая точка (критический алфавит) в которой происходит изменение топологии основного состояния РНК-подобной молекулы. В главе приводят ся аналитические и численные оценки критической точки топологического перехода и обсуждается связь данного топологического перехода с температурным фазовым пере ходом в замороженное состояние.

4.1 Зависимость свободной энергии РНК-подобных структур от алфавита Рассмотрим случайную последовательность длиной и алфавита, образующую вторичную структуру типа РНК (Рис. 1.2(a)). Зададимся вопросом о том, к какому пре делу стремится доля комплементарных пар в основном состоянии длинной ( ) цепи РНК. Другими словами, интерес представляет удельная (в расчете на одно звено) энергия основного состояния длинной РНК. Вначале, приведем доводы, подтвержда ющие наличие критического изменения удельной энергии в зависимости от алфавита.

Предположим, что существует критическое значение алфавита = такое, что при доля связанных мономерных звеньев стремится к 1, тогда как при предельная доля связанных звеньев меньше 1. Убедиться в этом можно следующим образом. Для того чтобы доля связанных звеньев в РНК-подобной структуре, образуе мом случайной последовательностью, была равна 1, каждой последовательности из возможных должен соответствовать так называемый путь Дика (т.е. путь Моцкина, в котором нет горизонтальных шагов) (Рис. 3.6(б)). Количество путей Дика () длины определяется формулой (3.8) (() = (, 0)). При = 0 и при 1 () имеет асимптотическое выражение 4/ (). (4.1) 3/ Заметим, что один и тот же путь Дика может описывать несколько РНК-подобных струк тур. Действительно, каждая пара подъем/спуск в пути Дика может быть, независимо от остальных, реализована разными способами (в случае РНК возможные варианты — это A-U, U-A, C-G и G-C). Таким образом, число различных первичных структур, для которых существуют полностью связанные вторичные структуры, не превышает (4)/ (, ) = ()/2. (4.2) 3/ Это оценка сверху, т.к., вообще говоря, одной и той же последовательности может соот ветствовать несколько различных РНК-подобных структур и, таким образом, несколько путей Дика. Тем не менее, естественно ожидать, что при число таких последо вательностей с двумя и более полностью связанными вторичными структурами стано вится малым. В таком случае, сравнивая (4.2) с полным числом возможных первичных структур 0 (, ) =, можно записать ( 1):

lim 1 ln (, ) lim 1 ln 0 (, ), для 2 (4.3) lim ln (, ) lim 1 ln (, ), для.

0 Откуда, = 4. Подчеркнем, что несмотря на то, что эта оценка является грубой оценкой сверху, она демонстрирует характерное изменение свойств РНК-структур со случайной первичной структурой.

Таким образом, при в пределе практически любой последовательно сти соответствует полностью связанная вторичная структура, и энергия оптимальной конфигурации на одну пару нуклеотидов стремится к 1, в то время как для случайных цепочек с доля последовательностей, допускающих совершенную вторичную структуру, экспоненциально мала. Добавление горизонтальных шагов в пути случай ных блужданий приводит к увеличению возможных РНК-подобных конфигураций (3.8), что позволяет сопоставить каждой случайной последовательности из ансамбля путь в случайном блуждании, соответствующий ее оптимальной вторичной структуре. Одна ко в этом случае доля связанных звеньев в оптимальной вторичной структуре остается в пределе меньше единицы. Путь Моцкина длиной, включающий горизон тальных шагов определяется (согласно (3.8)) как !

(, ) = (). (4.4) !( )!

Для нечетных ( ) функция (, ) равна 0. Для четных ( ) воспользуемся (4.1) и формулой Стирлинга для оценки асимптотического поведения:

( ) 1 ln ln (, ) = ln (1 ) ln + 4 (4.5) ln (, ) +, при +0, где введено обозначение = ( 0). Последнее выражение (4.5) показывает рост для малых, но конечных.

Как много различных структур могут иметь один и тот же путь Моцкина (Рис. 3.6(а))?

Как и в случае полностью связанных структур, каждая связанная пара имеет вырожден ность, тогда как каждый несвязанный мономер также может быть выбран разными способами. Суммарная вырожденность имеет вид (,, ) = ()/2 = (1+)/2, (4.6) и является возрастающей функцией.

А теперь оценим минимальное количество несвязанных мономеров (горизонтальных шагов в пути Моцкина), () = 1 (), в основном состоянии при 4. Наибольшее количество структур, имеющих в основном состоянии долю несвязанных мономеров меньше или равной определяется выражением:

(,, ) = (,, /) (, ). (4.7) = Для 4 и = 0 эта сумма меньше 0 (, ) =, и растет с увеличением так, что при некотором величины (,, ) и 0 (, ) сравниваются. Для 1 сумму (4.7) можно оценить методом перевала. Введем обозначение 1 (,, ) (, ) = lim ln.

0 (, ) Тогда (1 ) ln (1 ) ln ;

m ) (, ) = (4.8) ( ln 1 + 0;

m, где m = Для m сумма в (4.8) определяется вкладом от верхней границы,.

2+ тогда как для m максимум достигается в точке m и, таким образом, не зависит от верхнего предела суммирования. Величина () определяется из уравнения (, ) = 0. На Рис. 4.1 представлена функция () = 1 (). Напомним, что данная оценка является верхней границей, так как не учитывает корреляции между оптимальными конфигурациями.

Оценка (4.8) сделана в предположении так называемого среднего поля: связывание на каждой паре подъем/спуск Рис. 3.6 происходит независимо с вероятностью 1/ и все пути случайных блужданий считаются статистически независимыми. В разделе 4.3 приводится более точная оценка критического алфавита, учитывающая корреляции между конфигурациями.

Результаты численного моделирования для РНК-подобных структур со случайной последовательностью звеньев различного алфавита представлены на Рис. 4.1. Для про стоты предполагается, что комплементарные связи образуются согласно правилу A–A, т.е., только одинаковые мономеры могут комплементарно связываться. Напомним, что в реальных молекулах РНК действуют перекрестные правила комплементарности. Од нако, анализ случайных последовательностей показал, что правила комплементарности незначительно влияют на свойства РНК-подобных структур. Тогда как, комплементар ное связывания типа A–A позволяет исследовать цепочки не только с четным алфавитом как в случае перекрестного связывания, но и с нечетным. Соответственно, для каждого значения = 3, 4,..7 были построены зависимости удельной энергии = / от длины случайной первичной структуры. Как видно (Рис. 4.1(а)), удельная энергия при действительно стремится к некоторому усредненному значению, которое яв (a) (б) Рис. 4.1 (a) Зависимость удельной энергии от длины случайной последовательности с заданным алфавитом ;

(б) зависимость предельного значения энергии от алфавита для последовательностей с дискретным алфавитом (красным), в модели Бернулли (синим), и верхняя оценка энергии (черным) в модели независимого связывания. Дополнительный график: зависимость предельного значения энергии от алфавита в модели Бернулли демонстрирует, что критический алфавит является нецелым и принадлежит интервалу 2 3.

ляется только функцией от (Рис. 4.1(б)). Результаты численного моделирования суще ственно расходятся с аналитической оценкой (Рис. 4.1(б)). Зависимость, полученная в численном моделировании имеет критическую точку топологического перехода = 2, которая является очевидной оценкой снизу. Действительно, рассмотрим произвольную двухбуквенную последовательность, например, и бу дем последовательно находить комплементарые пары (в предположении А–А связы вания) следующим образом. Ближайшие соседи по цепи одного сорта образуют ком плементарную пару, и далее, вычеркиваются из последовательности. Легко видеть, что такая процедура приводит к формированию РНК-подобной структуры. Рассматрива емая цепочка после первой итерации будет выглядеть:, последующее вычеркивание приведет к. Понятно, что данная процедура для любой случай ной двухбуквенной последовательности приведет к тому, что, либо в остатке будет, либо последовательность будет полностью вычеркнута. Второй вариант озна чает, что все мономеры участвуют в формировании вторичной структуры, удельная энергия которой = 1. В случае остатка, данный участок цепочки образует конфигурацию с двумя пропусками, но, в термодинамическом пределе, = 1. Если структура образуется согласно перекрестным правилам комплементарности, то остат ком будет |1 2 | букв одного сорта, где 1 и 2 — количество мономеров A и B соответственно. В случайной последовательности |1 2 | 1/. Таким образом, для случайных последовательностей с алфавитом = 2 можно записать:

1 ;

для A-A связывания () = (4.9) 1 ;

для A-B связывания.

Таким образом, аналитическое расcмотрение буквенных последовательностей поз волило говорить о том, что критическое значение алфавита 2 4. Более строгое рассмотрение [89] показало, что критическое значение алфавита лежит в интервале:

2 3 1.

Подводя итог, подчеркнем еще раз, что при изменении алфавита, используемого в первичной структуре случайной последовательности, существует переход от полно стью связанной РНК-подобной структуры до структуры с конечной долей несвязанных мономеров. Такой переход в работе называется топологическим. Критическая точка то пологического перехода принадлежит интервалу (2 3), т.е. эффективно является нецелым.

Как можно трактовать нецелый алфавит в случайных последовательностях типа РНК? Далее, попробуем ответить на этот вопрос.



Pages:   || 2 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.