авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 ||

«ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ НАУКИ ИНСТИТУТ ХИМИЧЕСКОЙ ФИЗИКИ ИМ. Н.Н.СЕМЕНОВА РОССИЙСКОЙ АКАДЕМИИ НАУК ...»

-- [ Страница 2 ] --

4.2 Топологический переход в модели Бернулли Модель случайной последовательности с эффективно нецелым алфавитом может быть построена следующим образом. Будем считать, что матрица контактов в урав нении (2.20) является случайной: вероятность того, что, = 1, равна, а вероятность, = 0 равна соответственно 1. То есть теперь случайная последовательность характеризуется не первичной структурой — последовательностью мономеров из раз личных типов, как это было раньше, а некой матрицей контактов, (, )-элемент которой Для доказательства использовалось понятие максимального паросочетания без пересечений на слу чайном слове, работа была выполнена после доклада в ИППИ РАН (май 2012) разрешает или запрещает образование комплементарной пары между и мономером цепи. Мономеры цепи в данной модели не различаются по сортам и, в целом, любой мо номер может образовать связь с любым другим в цепи, однако, в среднем, вероятность такого события равна. Каждой последовательности в рассматриваемой модели можно сопоставить граф Эрдёша–Реньи, изображающего все возможные контакты между мономерами. Основное отличие данной модели от дискретных буквенных последова тельностей — нарушение свойства транзитивности. Если 1-й мономер может образовать связь со 2-м, а 2-й с 3-м, отсюда, вообще говоря, не следует (как это было для последова тельностей с дискретным алфавитом), что 1-й мономер может связаться с 3-м. Однако, как, например, уже упоминалось, подобная модель бернуллиевского сравнения в зада чах выравнивания случайных последовательностей является хорошей аппроксимацией.

Вероятности случайной матрицы контактов соответствует алфавит, равный:

=. (4.10) Таким образом, оказывается возможным генерировать случайную последовательность с любым нецелым значением алфавита. На Рис. 4.1(б) приведена зависимость удель ной энергии в термодинамическом пределе от алфавита (4.10), полученная в численном моделировании. Во-первых, отметим, что значения для бернуллиевского алфавита не более, чем на 1% отличается от соответствующих величин для случайных последовательностей с дискретным алфавитом, что оправдывает применимость данной модели. Случайный бернуллиевский полимер характеризуется критической вероятно стью. Для, в термодинамическом пределе, = 1 (так называемая «полочка»

на зависимости удельной энергии (см. дополнительный график на Рис. 4.1(б)), что со ответствует полностью связанной вторичной структуре, тогда как для, даже в пределе бесконечной длины, основное состояние характеризуется () количеством несвязанных мономеров. Критическое значение вероятности согласно (4.10) соответ ствует критическому значению алфавита = 2.6. Таким образом, модель Бернулли позволяет численно получить точку перехода.

Для более точной оценки критической точки топологического перехода были про ведены следующие численные эксперименты. Рассмотрим ансамбль, состоящий из ( = 105 ) случайных бернуллиевских полимеров длиной и подсчитаем коли чество последовательностей с полностью связанной вторичной структурой. Доля полностью связанных структур в таком ансамбле = / есть функция (см.

Рис. 4.2). Естественно ожидать, что в пределе (Рис. 4.2(а)), функция () вы рождается в ступенчатую функцию. Скейлинг-анализ полученных зависимостей () обеспечивает критическое значение = 0.37, что соответствует алфавиту:

2.67.

(а) (б) Рис. 4.2 Зависимость доли полностью связанных РНК-подобных структур в ансамбле случайных первичных структур различной длины (а) от параметра модели Бернулли;

скейлинг-анализ полученных зависимостей (б). Для каждого значения и было выполнено 105 накоплений.

Можно провести аналогию между данным топологическим переходом и переходом, наблюдаемым в теории перколяции [90]. В перколяционной теории задача формулиру ется следующим образом (одна из возможных формулировок). Рассмотрим протекание жидкости через пористую среду, причем пористую среду будем моделировать дис кретной решеткой (сетью) — набором сайтов, между которыми есть связи — каналы.

Жидкость протекает по этим каналам, которые могут быть открыты или закрыты c ве роятностью и 1 соответственно. Существует пороговое значение вероятности выше которой, протекание через данную среду возможно, т.е. существует связанный кластер на решетке, а ниже которой, построить связанный кластер невозможно. Пере ход между этими двумя состояниями в теории перколяции называют геометрическим фазовым переходом и относят к переходам второго рода [90].

Таким образом, можно предполагать, что топологический переход между полностью связанной РНК-подобной структурой и структурой с пропусками является фазовым переходом второго рода. В пользу этого предположения также свидетельствует непре рывное изменение вырожденности основного состояния (числа полностью связанных РНК-подобных структур) от вероятности.

Был также выполнен анализ областей алфавита, лежащего выше и ниже критической точки топологического перехода в модели Бернулли. Во-первых, области характеризу ются различной зависимостью от длины случайной последовательности: :

() 1 / для 1 (4.11) () 2 для, где 1 и 2 — некоторые константы. Для допереходной фазы ( ) характерно экспо ненциальное приближение к предельному значению удельной энергии ( = 1), тогда как в области больших алфавитов ( ) энергия приближается к своему предельно му значению степенным образом (Рис. 4.3). Показатель степени в (4.11) находится в пределах [0.75, 1] (сравните с (Рис. 4.1(а))). В допереходной области случайная после довательность из алфавита может быть охарактеризована некоторой релаксационной длиной, указывающей на характерный масштаб длин, на котором энергия основного состояния сходится к своему предельному значению = 1. Ясно, что зависимость ре лаксационной длины от вероятности имеет вертикальную асимптоту в точке =.

Естественно ожидать, что асимптотическое поведение () зависит от выбранной мо дели случайного полимера, в частности от правил комплементарности — см. (4.9).

Области отличаются также зависимостями флуктуаций свободной энергии от дли ны случайной последовательности. Допереходная область характеризуется быст рым (экспоненциальным) падением флуктуаций с ростом. Тогда как для, характерен степенной рост флуктуаций с увеличением длины последовательности (см. Рис. 3.2(б)).

(а) (б) Рис. 4.3 Асимптотическое поведение удельной энергии () до (а) и после (б) топологического перехода. Зависимость ( ()) в логарифмическом масштабе (а) и двойном логарифмическом масштабе (б) (см. (4.11)).

4.3 Аналитическая оценка критической точки тополо гического перехода в модели Бернулли 4.3.1 Метод среднего поля Для простоты переформулируем задачу в терминах планарных диаграмм (Рис. 1.7).

Рассмотрим граф, вершины которого (мономеры вдоль цепочки) перенумерованы, а матрица контактов — матрица инцидентности графа. Задача о полностью связанной РНК-подобной структуре на данном графе сводится к вопросу о том, как выбрать среди разрешенных контактов /2 связей, которые обеспечивают планарную структуру на заданном случайном графе, т.е. все вершины входят в конфигурацию ровно один раз и любые пары связей (1, 1 и (2, 2 ) удовлетворяют соотношению [91]:

(1 1 )(2 1 )(1 2 )(2 2 ) 0. (4.12) Другими словами, как разместить /2 непересекающихся арок, принимая во внимание ограничения, накладываемые матрицей. В модели Бернулли каждый элемент равен 1 либо 0 с соответствующими вероятностями и 1, кроме того, матрица контактов — симметричная с нулевыми диагональными элементами:

( ) = ([( 1) + (1 )( )] ( ) + ( )( )) ( 1). (4.13) Здесь () и () — дельта-функция Дирака и функция Хевисайда, соответственно. Для = 1 (когда все элементы равны 1), количество всех возможных арочных структур, удовлетворяющих (4.12) определяется числами Каталана (см. (4.4)) !

# = /2 =. (4.14) ( )!( 1)!

2 Когда = 1, некоторые из конфигураций # запрещены матрицей контактов. Введем обозначение 1 — вероятность, того, что одна выбранная из # конфигурация разрешена.

Очевидно, что 1 = /2. (4.15) Аналогично, определим как вероятность, что диаграмм из # разрешены, для = 2, например 2 = /2 /2 12 = 2, (4.16) где 12 2 равно количеству общих арок для двух случайно выбранных планарных диаграмм, усредненному по ансамблю #. Для 3 можно записать:

3 = (/2 )3 123 = 3/2 3 2 3. (4.17) Величины могут быть вычислены с любой точностью. К примеру, 2 лежит строго в интервале [1/15, 1/14.8]. Вероятность иметь по крайней мере одну планарную конфи гурацию для данной заполненности матрицы (4.13) определяется как:

#(# 1) = #1 2 + # 3 +... (4.18) Предполагая, что все диаграммы в ансамбле # независимы, т.е., =, для из (4.18) можно записать:

= 1 (1 1 )# = 1 exp(1 #). (4.19) В пределе больших, величина равна либо нулю, либо единице, в зависимости от соотношения между # и 1. Используя (4.15), для критического значения вероятности можно записать уравнение:

lim [#]2/ = 1. (4.20) Условие (4.20) можно интерпретировать как то, что переход наблюдается в точке, при которой плотность единиц в матрице контактов такая, что в среднем разрешена только одна планарная конфигурация. Вспоминая, асимптотику чисел Каталана (4.16), для критического значения вероятности получим = 1/4, что совпадает с верхней оценкой = 4 из (4.2).

4.3.2 Комбинаторная оценка Предположение о независимости планарных конфигураций соответствует так на зываемому приближению среднего поля. Естественным следующим шагом является введение ненулевых корреляций между конфигурациями: = 0. Чтобы учесть корре ляции между различными планарными диаграммами, поступим следующим образом.

Перепишем (4.20) как:

lim ( ) [#]2/ = 1, (4.21) где () — некоторая функция, учитывающая корреляции между планарными диаграм мами. Основная идея дальнейшего рассмотрения следующая: арки разной длины встре чаются в оптимальной планарной конфигурации с различной вероятностью. Рассмот рим полностью связанную планарную конфигурацию, состоящую из = арок, соединяющих точек. Возвращаясь к представлению планарных диаграмм через пу ти Дика (см.Рис. 3.6), можно увидеть, что арка между -ой и -ой точками возможна, только если -й и -й шаг имеют одну и ту же пространственную координату. Тогда можно определить вероятность арки между -ой и -ой точками как:

1 (1)/2 (, ) =. (4.22) 2+ В знаменателе правой части (4.22) стоит суммарное число возможных шагов вверх/вниз на длине ( + 1), в числителе — “1” соответствуют выбору шага вверх и вниз на позициях и соответственно;

число Каталана (1)/2 описывает все возможные конфигурации петли между парой (, ) (так как -й и -й шаги находятся на одной высоте, петля между ними должна быть тоже путем Дика). Вероятности (, ) зависят только от длины арки ( ) и не равны нулю только для арок нечетной длины, т.е., 1 1 (, + 1) = 4, (, + 3) = (, + 5) = т.д.. Если просуммировать (, ),, 16 1 (, + ) = по всем возможным арочным длинам, то результатом будет — =1 вероятность того, что в -ой позиции находится левая граница арки (шаг вверх).

Отметим, что доля коротких арок чрезвычайно высока. Действительно, вероятность, в типичной арочной конфигурации иметь арку длиной = 1 равна 1, арку длиной = 3, уже, и т.д.. С другой стороны, количество всех возможных кратчайших арок — ( 1). Поэтому, в типичной конфигурации среди них должны быть «разрешены».

Естественно, что веса таких коротких арок в бернуллиевской модели (элементы,+ матрицы контактов) выше, чем длинных арок.

Принимая во внимание эту выделенность коротких арок, оценим функцию () в (4.21). Вместо независимого выбора набора арок, теперь предположим, что построе ние типичной арочной конфигурации происходит следующим образом:

непересекающихся коротких арок ( = 1) из ( 1) возможных 1. выбор 2. выбор остальных = из длинных ( 2) арок 4 Так как общее число длинных арок порядка 2, будем считать, что длинные арки выбираются независимо друг от друга с вероятностью. И, таким образом, вклад от длинных арок в функцию () равен /4.

Иная ситуация при выборе кратчайших арок длиной “1”. Для бернуллиевского по лимера с матрицей контактов только единичных арок разрешены. Таким образом, выбор коротких арок для оптимальной конфигурации без пропусков оказывается сильно ограниченным. Вероятность выбрать /4 непересекающихся арок из разрешенных можно оценить следующим образом. Определим сначала число способов выбора непересекающихся единичных арок из всех ( 1) возможных (Рис. 4.4). Единичные арки можно рассматривать как стенки ящиков, тогда задачу можно переформулировать следующим образом. Будем интересоваться количеством способов, которыми можно заполнить ( 1) ящика /2 свободными точками (шарами). Результат известен из 3/ комбинаторики и = /, где — число сочетаний по.

Можно считать, что среди них 3 1 арок разрешены первичной структурой ( ) (3/41) полимера (матрицей контактов ) и величина /4 описывает вес коротких арок в полностью связанной РНК-подобной структуре случайного полимера. Учет корреляций между планарными конфигурациями на уровне единичных дуг приводит к следующими выражению для () (4.21):

] [ (3/41) 3/ ()/2 = /4 /4 /4. (4.23) В пределе, после упрощений, получим:

Рис. 4.4 Пояснение к вычислению (): (a) Выбор единичных арок на вершинах случайного графа ( свободных вершин) аналогичен комбинаторной задаче о 1 ящикам (б).

расположении точек по 2 3 3 3 1 3 1 3 ln.

ln () = ln + ln ln (4.24) 2 2 2 2 2 Подставляя этот результат в (4.21):

ln ( ) = ln 4;

(4.25) 0.35 ( = 2.87).

4.3.3 Матричный подход Еще один подход оценки критического алфавита основан на матричном описа нии вторичной структуры РНК (1.5). Напомним, что статистическую сумму (, ) случайного полимера можно представить через случайные эрмитовы матрицы как (см. (1.7),(1.8)):

1... 0 tr (1... ) 1... 0, (, ) = (4.26) 1...

где 0 0 {, 1,..., } = ( ) tr( ). (4.27) 2, В отсутствии замороженного беспорядка, т.е., если 1, задача (4.26) может быть решена точно. В частности, множитель /2,0 перед /2, описывающий планарные конфигурации с /2 арками (1.10), т.е. полностью связанные структуры, вносит наи больший вклад в общую статистическую сумму полимера и определяется числами Каталана:

4/.

lim ( ;

) = /2 (4.28) (/2)3/ Как и ранее будем вычислять функцию () в (4.21) усредняя статистическую сумму (, ) по распределению (4.13). Для этого выполним стандартное преобразование Хаббарда-Стратоновича и будем интегрировать по с весом (4.13):

( ) (, ) = (4.29) 1 tr( ), tr (1... ) = = где = 0 +, и 0 = tr( ), (4.30) (1 ) [tr( )] = 8 (4.31) (1 )(1 2) [tr( )]3 +...

48 Величина 0 соответствует единичной матрице контактов с дополнительным фак тором. Учет только этого слагаемого, после обратного преобразования Хаббарда Стратоновича, приводит к () =, и оценке = 4, совпадающей с оценкой в пред положении среднего поля. Действие (4.31) сдвигает значение в сторону меньших значений. Но, так как содержит бесконечное число слагаемых (4.31), теория воз мущений в данном случае неприменима. В этой связи было предложено следующее приближение: все поля { }=1,..., в (4.31) эквивалентны, поэтому можно считать, что в среднем, tr( )0 не зависит от (, ). В рамках данного средне-полевого приближения можно сделать замену = 0, где:

(1 ) = tr( ) 8 (4.32) (1 )(1 2) tr( ) +...

48 Упрощение выражения (4.32) приводит к следующему уравнению на пропагатор :

[ ( )] 1 log 1 + exp =. (4.33) ] [ Выражение (4.33) дает = 2 log 1 11/, и окончательно можно написать:

() = tr( ), (4.34) 2 где ]) ( [ 1 1/ () = = 2 log 1. (4.35) Подстановка (4.35) в (4.21) приводит к оценке критического алфавита * = 0.4551.

Большая расходимость полученного результата с численным = 0.37 означает, что предложенного приближения недостаточно для описания топологического перехода.

4.4 Переход случайной РНК в замороженное состояние, ограниченный топологическим переходом Рассмотрим как данный топологический переход ограничивает фазовый переход в замороженное состояние 1.4. Отметим, что аналогичный вопрос исследуется и в теории перколяции, где тоже предполагается взаимосвязь перколяционного перехода и темпе ратурного фазового перехода, наблюдаемого, например, в модели Изинга [92].

Были проанализированы температурные зависимости свободной энергии пинча (2.2) случайной последовательности в модели Бернулли разной вероятности. Как уже об суждалось, температура перехода в замороженное состояние непосредственно свя зано со средним числом пропусков в структуре основного состояния. В [38] было показано, что температура перехода не превосходит * * = 1, (4.36) где — среднее число пропусков на пару мономеров, а определяется из зависимо сти наибольшего общего непрерывного сегмента двух половинок последовательности РНК: = 1 ln (см. Рис. ??). Известно, что для цепочек РНК = ln 2. Для случай ного бернуллиевского процесса определяется как = ln(1/) [79]. Таким образом, выражение (4.36) можно переписать в виде * =. (4.37) ln(1/) Доля несвязанных мономеров растет с ростом алфавита 1/ сильнее, чем лога рифм (см. Рис. 4.1(б)) и из (4.37) непосредственно следует, что в допереходной области ( ) фазовый переход в замороженное состояние наблюдаться не будет. Температура перехода эффективно равна нулю, т.е., случайный полимер во всем температурном диапазоне находится в расплавленной фазе. Данное предположение дополнительно под тверждается наблюдением того, что для случайных последовательностей с алфавитом = 2 переход имеет место только при накладывании ограничений на структуру, а именно, введением минимального размера петли [39].

Результаты численного моделирования представлены на Рис. 4.5. Был проанализиро ван температурный коэффициент ( ) (2.4) для последовательностей с разной вероят ностью. Температура перехода определяется точкой, в которой нарушается линейная зависимость ( ) = 2, характерная для расплавленной фазы. Из полученных данных видно, что температура перехода уменьшается с ростом вероятности и в допере ходной области становится равной нулю ( = 0.5 на Рис. 4.5). Вблизи критического значения численный эксперимент усложняется тем, что корректный анализ требует рассмотрения достаточно длинных случайных цепочек (с длиной, превышающей соот ветствующую релаксационную длину (), см. (4.11)), что приводит к существенному увеличению времени численного моделирования. Также стоит отметить, что в связи с наблюдаемой степенной зависимостью свободной энергии основного состояния от дли ны последовательности ((4.11)), аппроксимация уравнением (2.2) вблизи точки = 0, вообще говоря, неверна.

Предполагается, что критическая точка топологического перехода между полностью связанной РНК-подобной структурой и структурой с пропусками является пороговым значением для термодинамического перехода. В области последовательностей возможна только расплавленная фаза вне зависимости от температуры. Рис. 4.6 пока 0. 0. 0. a(T) p=0. p=0. 0.2 p=0. p=0. 0. 0.0 0.1 0.2 0.3 0.4 0. T Рис. 4.5 Зависимость коэффициента ( ) (1.4) для случайной последовательности разной вероятности в модели Бернулли.

зывает фазовую диаграмму на (, ) плоскости. Это предположение подтверждается исследованием энергии пинча от длины случайной последовательности в точке = 0.

Точка пересечения зависимостей для разных длин (см. дополнительный график на Рис. 4.6) разделяет два топологических режима и близка к наблюдаемому критическо му алфавиту.

4.5 Другие модели нецелого алфавита Основной недостаток бернуллиевской модели полимера заключается в отсутствии ясного соответствия матрицы контактов для произвольного и первичной структуры полимера. Как уже указывалось, в модели Бернулли нет разделения на сорта мономеров, все мономеры, рассматриваются однотипными. В этом разделе, речь пойдет о некоторых подходах генерации полимера с нецелым алфавитом и разными сортами мономеров.

расплав структура с пропусками полностью связанная структура замороженное состояние Рис. 4.6 Фазовый переход в замороженное состояние, ограниченный топологическим переходом в модели Бернулли. Дополнительный график: зависимость энергии пинча в пределе 0 от вероятности.

4.5.1 Метод концентраций Одна из самых простых моделей нецелого алфавита, сохраняющего свойство тран зитивности — модель концентраций. В такой модели предполагается, что случайный полимер состоит из трех типов мономеров, A, B и C, но мономеры распределены в цепочке не случайно, а коррелировано. В модели так называемых «локальных концен траций» предполагается, что концентрация, количество мономеров третьего типа [] не равна концентрации мономеров [] = [], а зависит от алфавита. В частности, кон центрацию [] можно определить по заполненности матрицы контактов. Изменение концентрации [] от 0 до описывает последовательности с нецелым алфавитом от = 2 до = 3. Однако, для алфавитов, немного превышающих = 2 ( = 2 + ), данная модель приводит к случайной двухбуквенной последовательности, слабо разбавленной третьим типом мономеров. Из-за малого количества [], эти мономеры появляют ся редко в цепочке, и из-за специфического комплементарного взаимодействия С–С, это приводит к сильным ограничениям на конфигурации основного состояния. Как уже упоминалось, основное состояние характеризуется большим количеством корот ких арок, т.е., взаимодействием ближайших соседей в цепочке. Таким образом, важнее оказывается не количество различных типов мономеров в первичной структуре, а их распределение. Модель концентраций может быть улучшена, если распределять [] мо номеров третьего типа не случайно, а согласно некому распределению, характерному для случайных трехбуквенных (двухбуквенных) последовательностей. Грубо говоря, это приведет к тому, что мономеры третьего типа C будут появляться в первичной структу ре блоками. Но даже такая модель обладает существенным недостатком — выделенной ролью мономеров типа C, по сравнению с мономерами типа А и B.

4.5.2 Коррелированная случайная последовательность Модель, которая устраняет этот недостаток — модель так называемой коррелирован ной последовательности, в которой распределение трех типов мономеров является не случайным, а сильно коррелированным. Различный алфавит определяется в таких по следовательностях не количеством (концентрацией) мономеров, а тем, насколько силь но скоррелировано появление мономеров различного типа в цепочке. Распределение мономеров в первичной структуре определяется согласно Марковскому процессу [88]:

A B C 1 2 A 1 B 1 2, C т.е., вероятность встретить, например, мономер типа А за мономером А не равна ве роятности появления А после B (или C). Изменение в диапазоне [0, 3 ] обеспечивает диапазон алфавитов [1, 3]. Взаимосвязь между параметром модели и алфавитом мож но установить, используя определение информационной энтропии по Шеннону [93]:

) ( 1 =. (4.38) 1 Результатом данной модели является полимер с блочной первичной структурой, при чем размер блока зависит от параметра модели. На Рис. 4.7 представлены результаты численного моделирования в модели такой коррелированной последовательности. Скач кообразного изменения удельной энергии от алфавита в численном моделировании не Рис. 4.7 Модель коррелированной последовательности: зависимость удельной энергии от алфавита (красным);

для сравнения приведена зависимость предельной энергии в модели Бернулли (черным).

наблюдается. Отметим, что даже для алфавитов, эффективное значение которых мень ше 2, идеальные полностью связанные структуры не образуются. Объяснить такую зависимость можно следующим образом.

После процедуры вычеркивания (см. 4.1), корреллированный полимер с трехбуквенным алфавитом сводится к последователь ности со случайно распределенными мономерами трех сортов, для которой, как бы ло показано (Рис. 4.1) свойственно образование () пропусков. Длина остаточного полимера (после вычеркивания) зависит от параметра, и для достаточно длинных последовательностей пропорциональна. Таким образом, любая модель с тремя сорта ми мономеров (коррелированная последовательность или модель концентраций) всегда сводится к модели случайной последовательности с алфавитом = 3, который лежит в послепереходной области. Тем не менее, стоит отметить, что для зависимости удель ной свободной энергии (см. Рис. 4.7) в модели коррелированной последовательности характерен резкий спад удельной энергии основного состояния при.

4.5.3 Рациональный алфавит Другая модель, частично сохраняющая свойство транзитивности, — модель рацио нального алфавита — заключается в следующем. Последовательность с алфавитом можно представить, как полимер, состоящий из P сортов мономеров, правила ком плементарности для которых разрешают Q связей для каждого мономера. Например, алфавит = означает пятибуквенный алфавит в первичной структуре и с правилами комплементарности, организованными, к примеру, по пятиугольнику (Рис. 4.8). Такие правила можно построить для рационального алфавита любой величины. Численные результаты для данной модели приведены на Рис. 4.8 и показывают критическое изме нение топологии вторичной структуры РНК.

Отметим, что модель чувствительна к выбору и, так например, один и тот же 14 алфавит = 2.8, представленный как и дает разные результаты для удельной 5 энергии основного состояния. В пределе рассматриваемая модель сводится к модели Бернулли. Модель рационального алфавита, интуитивно, кажется ближе к ал фавиту, используемого природой в молекулах РНК. Как указывалось, в молекулах РНК, помимо комплементарных пар, образуются неканонические пары (1.1), т.е. правила об разования связей, во-первых, не транзитивны, а во-вторых, система правил похожа на систему связей в модели рационального алфавита (Рис. 4.8).

Каков алфавит в реальных молекулах РНК? Понятно, что учет неканонических пар эффективно приводит к уменьшению алфавита. С другой стороны, учет, к примеру, минимальной длины петли увеличивает алфавит в последовательностях РНК. Образо вание псевдоузлов и стэкинг взаимодействия приводит к сдвигу алфавита к меньшим значениям. Таким образом, фактический алфавит в молекулах РНК определяется мно гими факторами. Однако, логично предполагать, что алфавит в РНК находится вблизи критического. Почему выгодно реальным молекулам РНК иметь алфавит вблизи кри тического? Для того чтобы РНК выполняла свою биологическую функцию, она должна удовлетворять следующим критериям: i) ее фолдинг должен быть достаточно уникален и ii) структура должна быть устойчива к тепловому шуму. Короткие алфавиты не обеспечивают первый критерий, так как для допереходной фазы характерна сильная вырожденность основного состояния. С другой стороны, длинным алфавитам свойственны структуры с длинными петлями — несвязанными мономерами, которые Рис. 4.8 Модель рационального алфавита: зависимость удельной энергии основного состояния от алфавита (красным). Для сравнения приведена зависимость, полученная в модели Бернулли (черным).

неустойчивы к тепловым флуктуациям. Таким образом, биологический алфавит, по видимому, находится вблизи критического.

Глава Описание РНК-подобной структуры в терминах оптимизационной транспортной задачи В данной главе показывается, что задача о вторичной структуре РНК-подобного по лимера может быть сформулирована в терминах оптимизационной транспортной задачи (ОТЗ). Заимствованная из ОТЗ процедура оптимизации позволяет описать топологиче ские свойства РНК-подобных структур, если задано распределение расстояний между мономерными звеньями, и потенциал взаимодействия между мономерами имеет вид возрастающей и выпуклой вверх функции от расстояния.

5.1 Оптимизационная транспортная задача Классическая транспортная задача заключается в поиске оптимального распределе ния однородных объектов из пунктов наличия (например, железные рудники) к прием никам (например, заводы) с минимизацией затрат на перемещение. Затраты на пере возку одной единицы руды с рудника до завода задаются ценовой функцией (, ), поэтому ОТЗ может быть сформулирована как задача линейного программиро вания. Транспортная задача ещё называется задачей Монжа-Канторовича. Она впервые была формализована французским математиком Гаспаром Монжем в 1781 году. Основ ные продвижения в этой задаче сделал выдающийся советский математик и экономист Леонид Канторович в середине 20-го века [94]. В теории сложности вычислений транс портная задача принадлежит классу сложности NP ( non-deterministic polynomial) [95], т.е. решение задачи не определяется за время, не превосходящее полинома от размера данных. Существует множество методов и алгоритмов решения этой задачи в разных предельных случаях, например, симплекс-метод, метод северо-западного угла, метод наименьшего элемента, метод падающего камня, метод потенциалов [96]. Для матема тического удобства используют и другие эквивалентные формулировки транспортной задачи [96, 97].

В частности, ОТЗ может быть сформулирована как задача поиска оптимального полного паросочетания на полном графе [98]. Паросочетанием на графе называется множество попарно несмежных рёбер, то есть рёбер, не имеющих общих вершин.

Паросочетание, включающее в себя все вершины графа называется полным. Ясно, что поиск полного паросочетания на двудольном графе, одни вершины которого описывают пункты наличия продукта, а другие пункты доставки (и = ), соответствует построению оптимального плана в ОТЗ. Вес ребра графа, соединяющего вершину c вершиной определяется соответствующей ценовой функцией (, ).

Рассмотрим ОТЗ на прямой, когда все пункты наличия продукта и пункты достав ки распределены вдоль одного пути. Следуя [99], будем считать ценовой функцией выпуклого типа, если для любых 1, 2, 1, 2 из R неравенство (1, 1 ) + (2, 2 ) (1, 2 ) + (2, 1 ) (5.1) означает, что интервалы [1, 1 ] и [2, 2 ] либо не пересекаются, либо один полностью лежит в другом. Примерами такой ценовой функции служат: (, ) = | | с 0 1, или (, ) = ln | | с доопределением на диагонали =.

Если ценовая функция симметрична и пространственно однородна, т.е., (, ) = (| |),функция должна быть строго возрастающая и строго выпуклой вверх [99].

Хотя такое рассмотрение является некоторой идеализацией ОТЗ, оно кажется вполне разумным, если считать, что доставка руды производится по одному маршруту (одна железнодорожная линия), а выпуклость ценовой функции отражает увеличение сум марных затрат с увеличением расстояния доставки, несмотря на уменьшение удельных затрат на один километр. Задаче с выпуклой вверх ценовой функцией уделено гораз до меньше внимания чем аналогичной задаче с выпуклой вниз функцией затрат. Было показано, что для выпуклой вверх ценовой функции оптимальный транспортный план обладает некоторыми топологическими особенностями [98–100]. Рассмотрим эти осо бенности, сформулировав ОТЗ следующим образом.

Определим набор точек 1 2 · · · 2 на действительной прямой R и рассмот рим полный граф 2 на этих точках, при этом каждому ребру графа (, ) припишем вес (, ). ОТЗ заключается в поиске полного паросочетания с минимальным сум марным весом на графе 2.

На Рис. 5.1 графически представлена процедура оптимизации в ОТЗ с выпуклой вниз ценовой функцией. Взяв ценовую функцию в виде (, ) = ln | |, мож но непосредственно проверить, что паросочетание с минимальным суммарным весом (1, 1 ;

...;

, ), где ln | |, (1, 1 ;

...;

, ) = {i,jM(K2n )} достигается на планарных конфигурациях (см. Рис. 5.1). Здесь введено обозначение (2 ) для полного паросочетания на графе 2.

x1 x2 x3 x4 y3 y1 y4 y2 x1 x2 y2 y1 x3 x4 y4 y Рис. 5.1 Планарные конфигурации как результат оптимизации с выпуклой вниз ценовой функцией.

5.2 Модель случайных интервалов первичной структу ры РНК-подобной молекулы Построим модель РНК-подобной структуры, в котором энергия взаимодействия мо номеров, — выпуклая вниз функция расстояния между мономерами вдоль цепи.

Возьмем, = ln | |;

( = ), (5.2) где — некоторая положительная величина, и, — координаты мономеров и вдоль последовательности. В предложенной модели, расстояния = |+1 | между соседними мономерами подчиняются распределению ( = ). Схематически типич ный полимер в данной модели изображен на Рис. 5.2 в арочном представлении (a) и в представлении пути случайного блуждания (б).

di 12 3 4 9 (a) (b) Рис. 5.2 Модель случайных интервалов РНК-подобной молекулы: арочное представление (a) и соответствующий путь Дика (б).

Подчеркнем, что главная особенность модели заключается в том, что потенциал взаимодействия между мономерами, — выпуклая вниз и возрастающая функция расстояния между звеньями цепи (5.2). Естественно, можно взять, и в виде, = | |1, где 0 1 1, или, = | |2, где 2 0 ( = ), вид функции, определяет лишь детали модели.

После упрощений функцию свободной энергии основного состояния (2.20) можно переписать в форме:

[ ],+ = min, + +1,1 + +1,+, (5.3) =+1,+3,...,+ с граничными условиями +1, = 0 для любого. Заметим, что достаточно рассмат ривать только петли четной длины. Петли нечетной длины приводят к образованию пропусков, что энергетически невыгодно. Отметим особенности функции (5.3).

1. Выражение (5.3) содержит все возможные планарные диаграммы на полном графе, +1,..., +. В частности, это означает, что,+,+ + +1,+1 (5.4) для любых и всех четных 1 и,+,+ + ++1,+ (5.5) для всех и 1 с четными и. Последнее свойство может быть рассмот рено как субаддитивность функционала : для двух неперекрывающихся конфигура ций 1 2 · · · + и ++1 ++2 · · · +, величина,+ для единой оптимальной конфигурации не больше суммы величин,+ и ++1,+ на частичных конфигурациях.

2. Для ценовой функции (, ) = выпуклого типа, функционал энергии не только субаддитивен, но имеет и более строгое свойство: для любого, четного c 1 и нечетного с + 1, функция удовлетворяет неравенству,+ + +,+,+ + +,+ (5.6) неравенство (5.5)— частный случай (5.6), соответствующий = + 1. Это свойство функционала называется субмодулярностью. Отметим, что при 1 2 1, (5.6) эквивалентно (5.1). Для = 2 и = 2:

,+,+2 + +2,+ +2,+2 (5.7) В [98] было показано, что функция удовлетворяет рекурсивному соотношению:

[ ],+2 + +2,+ +2,+2, (5.8),+ = min,+ + +1,1 ;

включающему (5.3) и (5.7). Другими словами, – субмодулярная функция, удовлетво ряющая также (5.3).

Таким образом, функция, описывающая свободную энергию основного состояния,+ для выпуклого потенциала взаимодействия между мономерами удовлетворяет не только стандартному уравнению (2.20), но также и локальной рекурсии (5.8). Полный вывод уравнения (5.8) приведен в [98].

5.3 Топологические свойства РНК-подобных структур в модели случайных интервалов Характеристикой топологии оптимальной конфигурации может служить характер ный размер конфигурации или высота соответствующего пути Дика (см. Рис. 1.6). Вы сота конфигурации показывает максимальную вложенность арочной структуры. Опи шем топологические особенности РНК-подобной структуры полимера с мономерными звеньями, расстояние между которыми подчиняется распределению Гаусса и степенно му распределению.

5.3.1 Численное моделирование Распределение Гаусса Рассмотрим случайную цепочку, в которой расстояния между соседними мономера ми = |+1 | подчиняются распределению Гаусса, определенному на интервале [ ]: () 22, min max (, ) = (5.9) 0, иначе, )] [ ( ) ( где = 2 erf max + erf min - нормировочная константа, определенная 2 max из условия min (, ) = 1. Чтобы избежать противоречий, потребуем, чтобы все энергии (5.4) были положительны. Без потери общности, были выбраны следующие параметры распределения в (5.9): = 2;

min = 1;

max = 3. Функция распределения (5.9) представлена на Рис. 5.3 для различных значений параметра.

Рис. 5.3 Модель случайных интервалов первичной структуры РНК-подобной молекулы: распределение Гаусса () расстояний между мономерными звеньями в цепи полимера для разных значений параметра распределения = 0.1;

0.5;

2.0.

Результаты численного моделирования показали наличие критического поведения топологии оптимальной конфигурации от параметра распределения (). Значениям cr соответствует узкое распределение Гаусса. Несмотря на дисперсию распреде ления, выгодным оказывается попарное взаимодействие ближайших соседей. Высота оптимальной конфигурации равна 1 (см. Рис. 5.4). При cr высота конфигурации превышает 1. Критическое изменение высоты РНК-подобной конфигурации от парамет ра распределения носит характер кроссовера, а не фазового перехода [101]. Величина cr определяет точку кроссовера и зависит от длины последовательности. С увели чением критическая точка сдвигается к меньшим значениям и, очевидно, достигает нуля в пределе. Рис. 5.4 представляет результаты численного моделирования для последовательностей длины = 250, 500, 1000 мономеров. Выше точки кроссо вера, для cr высота основной конфигурации растет монотонно с и достигает некоторой средней величины, характерной для равномерного распределения интерва лов ( ).

Рис. 5.4 Модель случайных интервалов РНК-подобной структуры: зависимость высоты конфигурации от параметра распределения Гаусса для первичных структур разной длины.

Степенное распределение Более естественным распределением расстояний между мономерными звеньями яв ляется степенное распределение без характерного размера (scale-free). Определим сле дующее распределение интервалов :

(, ) =, (5.10) 1 + с 0 и min max. Нормировочный фактор (max, min ) (max, min ) = [ (max ) (min )]1 ;

(5.11) 1 1, ), () = 2 1 (1,, 1 + где 2 1 (...)– гипергеометрическая функция. В численном моделировании были исполь зованы: min = 1;

max = 20. В отличии от распределения Гаусса, в таком степенном распределении, вероятность иметь ближайших соседей на большом расстоянии друг от друга (так называемые «тяжелые хвосты» распределения) не мала экспоненциально.

Рис. 5.5 Модель случайных интервалов первичной структуры РНК-подобной молекулы: cтепенное распределение (, ) расстояний между мономерными звеньями вдоль цепи для разных параметров.

Наличие таких тяжелых хвостов в распределении существенно влияет на топологию оптимальной конфигурации. С увеличением в (5.10) степень вложенности ведет себя не монотонно: при малых 0 она растет до некоторого максимального зна чения (при 1), а затем уменьшается до величины, характерной для равномерного распределения интервалов (при ) — см. Рис. 5.6.

Именно тяжелые хвосты распределения приводят к вложенности в оптимальной конфигурации. В следующем параграфе описываются аналитически топологические особенности случайного полимера в данной модели, обусловленные свойствами рас пределений.

5.3.2 Аналитическое описание Вложенность конфигурации РНК-подобной молекулы в модели случайных интер валов первичной структуры обусловлена двумя факторами. Во-первых, вложенность Рис. 5.6 Модель случайных интервалов: зависимость высоты оптимальной конфигурации от параметра степенного распределения для первичных структур разной длины.

возникает из геометрии первичной структуры последовательности. При определенном соотношении между тремя последовательными интервалами 1,, +1 вложенная конфигурация оказывается энергетически выгоднее конфигурации с последовательно взаимодействующими мономерами. Возникающая вложенность отражает локальные свойства первичной структуры РНК-подобной молекулы.


С другой стороны, возможно образование большой арки между далекими по цепи мономерами и, если конфигурация петли между ними характеризуется минимумом функции +1,1. Энергия петли компенсирует затраты энергии на образование длин ной арки (, ). Такая вложенность отражает геометрические особенности полимера в целом.

Рассмотрим подробнее первый фактор — возникновение вложенности на трех по следовательных интервалах, обусловленное локальными геометрическими свойствами полимера. Вложенная конфигурация энергетически выгоднее, чем последовательное спаривание, если 1,+2, 1,,,+1, +1,+2 удовлетворяют:

1,+2 +,+1 1, + +1,+2. (5.12) Подставляя, = ln | |, легко получить из (5.12) условия на длины интерва лов 1,, +1 : 1 (5.13) +1 (1 + ) или в более симметричном виде:

( ) 1 + +1 41 + 1.

1+ (5.14) (1 + +1 ) Зная вид распределения () на [min, max ], можно вычислить вероятность того, что неравенство (5.14) имеет место. Так как интервалы 1,, +1 независимы, вычис ляемая вероятность определяется трехмерным интегралом ( ) + max max 1+ (+) = () () (), (5.15) min min min где интегрирование по 1 заменено на интегрирование по переменной, +1 на и на.

Интеграл (5.15) описывает появление вложенности первого уровня ( = 2). Бо лее того, он присутствует как множитель в вероятности иметь вложенность второго уровня ( = 3), так как любая вложенность последующего уровня требует наличия вложенности предыдущего уровня. Таким образом, естественно ожидать, что зависи мости () и () (Рис. 5.4, Рис. 5.6) будут отражать свойства распределения Гаусса (, ) и степенного распределения (, ) соответственно.

Распределение Гаусса Функция для распределения Гаусса (, ) (5.9) с параметрами ( = 2;

min = 1;

max = 3) представлена на Рис. 5.7. Отметим, что зависимость () повторяет про филь (), полученный в численном моделировании (Рис. 5.4). Кривая полученная аналитически отражает только локальные геометрические свойства первичной струк туры полимера. Кривая хорошо описывает «зарождение» вложенности в оптимальной конфигурации. Однако, она не отражает, например, влияние длины полимера на кри тическую точку кроссовера. Дело в том, что длина полимера относится к парамет рам, влияющим на глобальные свойства вторичной структуры. Учесть аналитически Рис. 5.7 Аналитическое описание модели случайных интервалов: зависимость функции (5.15) от параметра распределения Гаусса.

вклад глобальных геометрических особенностей цепочки даже в рамках распределе ния Гаусса оказывается сложным. Отметим также, что появление вложенности второго уровня в Гауссовом полимере ( 2) уже обусловлено глобальной реорганизацией связей. Действительно, если предположить что вложенность второго уровня локаль на, т.е. имеет место конфигурация с тремя последовательно вложенными друг в дру га арками (такая конфигурация реализуется на шести последовательных интервалах), то условие (5.12) должно выполняться для 2, (1), +2, где введено обозначение (1) = 1 + + +1. Наименьшее значение интервала (1), как следует из (5.12), равно (1) = 2( 2+1)min +min. Для рассматриваемого распределения Гаусса (1) max, что приводит к противоречию. Таким образом, конфигурации с 2 имеют, по крайней мере, одну длинную связь.

Степенное распределение Аналогичный анализ был проведен и для степенного распределения (, ) (5.10).

Аналитическая кривая имеет четкий максимум (Рис. 5.8) в точке = 1. При 1 вероятность стремится к нулю. В отличие от распределения Гаусса, вложенность второго уровня разрешена распределением, (1) max, однако петли третьего уровня уже запрещены — (2) = 2( 2 + 1)(1) + (1) max. Таким образом, конфигурации с 3 обусловлены глобальными геометрическими особенностями цепочки.

Рис. 5.8 Аналитическое описание модели случайных интервалов: зависимость функции (5.15) от параметра степенного распределения.

Было показано, что в модели случайных интервалов РНК-подобной молекулы для распределения Гаусса имеет место топологический кроссовер между конфигурацией с последовательным взаимодействием мономеров и вложенной. Параметр, контролиру ющий кроссовер — значение дисперсии в распределении Гаусса (, ).

Для степенного распределения (, ) (5.10) наличие тяжелых хвостов приводит к другому топологическому поведению в зависимости от параметра распределения.

Степенное распределение характеризуется наличием максимума функции () при = 1.

Важный результат данного исследования заключается в том, что показана возмож ность перейти от нелокального уравнения на свободную энергии основного состояния РНК (2.20) к локальной рекурсии (5.8). В рамках предположения выпуклого потенциала взаимодействия между мономерами, выражение (5.8) существенно упрощает алгоритм предсказания вторичной структуры. Время численного счета уменьшается с 3 до 2, где — длина последовательности.

Заключение В диссертационной работе представлен анализ топологических свойст РНК подобных молекул со случайной первичной структурой методами статистической фи зики и теории случайных процессов. Основные результаты работы заключаются в сле дующем.

1. Получено выражение для статистической суммы, описывающие взаимодействие двух сополимеров, учитывающий способность каждого из сополимеров образовы вать РНК-подобную структуру с иерархией петлевых участков. Разработан соот ветствующий алгоритм динамического программирования вычисления свободной энергии основного состояния таких РНК-подобных молекул.

2. Численно и аналитически показано критическое поведение РНК-подобной струк туры в зависимости от используемого в первичной структуре алфавита. Суще ствует две области: для алфавитов свойственна максимально связанная вторичная структура без пропусков, тогда как для вторичная структура содержит конечную долю несвязанных мономеров. Аналитическая оценка точки топологического перехода = 2.87 близка к наблюдаемой в численном модели ровании = 2.67.

3. Показано, что описание топологии РНК-подобной структуры может быть сведено к оптимизационной транспортной задаче. Разработан алгоритм вычисления сво бодной энергии в модели первичной структуры со случайными расстояними меж ду мономерными звеньями вдоль по цепи и потенциалом взаимодействия между мономерами, заданного выпуклой функцией от расстояния. Показана зависимость топологии РНК-подобной структуры от параметров распределения.

Список сокращений и условных обозначений ДНК — дезоксирибонуклеиновая кислота, РНК — рибонуклеиновая кислота, А — аденин, U — урацил, C — цитозин, G — гуанин, мРНК — матричная РНК, нкРНК — некодирующая РНК, НОП — наибольшая общая подпоследовательность, KPZ — Кардар-Паризи-Занг (Kardar-Parisi-Zhang), ОТЗ — оптимизационная транспортная задача.

Литература 1. Птицын Б.О., Финкельштейн А. Физика белка: Курс лекций // Москва: Университет, 2002. — 376 C.

2. Гросберг Ю.А., Хохлов Р.А. Статистическая физика макромолекул / под ред. Глав ной редакции физико-математической литературы // Москва: Наука, 1989. — С.

3. Workman C., Krogh A. No evidence that mRNAs have lower folding free energies than random sequences with the same dinucleotide distribution // Nucleic Acids Research. — 1999. — V. 27. — N. 24. — P. 4816-4822.

4. Clote P., Ferre F., Kranakis E., Krizanc D. Structural RNA has lower folding energy than randomRNA of the same dinucleotide frequency // RNA. — 2005. — V. 11. — N. 5. — P. 578-591.

5. Brezin E.E., Itzykson C., Parisi G., Zuber J.B. Planar diagrams // Communications in Mathematical Physics. — 1978. — V. 59. — N. 1. — P. 5-51.

6. Watson D.J. J, Crick H.C.F. Molecular structure of nucleic acids // Nature. — 1953. — V. 171. — P. 737-738.

7. Alberts B., Johnson A., Lewis J., Raff M., Roberts K., Walter P. Molecular Biology of the Cell / 4th ed. // New York: Garland Science, 2002. — 1616 P.

8. Vendeix F.A.P., Munoz A.M., Agris P.F. Free energy calculation of modified base-pair formation in explicit solvent: A predictive model // RNA. — 2009. — V. 15. — N. 12. — P. 2278-2287.


9. Varani G., and McClain W.H. The G–U wobble base pair // The European Molecular Biology Organization Reports. — 2000. — V. 1. — N. 1. — P. 18-23.

10. Chen J.-L. Functional analysis of the pseudoknot structure in human telomerase RNA // Proceedings of the National Academy of Sciences. — 2005. — V. 102. — N. 23. — P. 8080-8085.

11. Zuker M., Stiegler P. Optimal computer folding of large RNA sequences using thermodynamic and auxiliary information // Nucleic Acids Research. — 1981. — V. 9. — N. 1. — P. 133-138.

12. Akutsu T. Dynamic programming algorithms for RNA secondary structure prediction with pseudoknots // Discrete Applied Mathematics. — 2000. — V. 104. — P. 45-62.

13. Zuker M. Mfold web server for nucleic acid folding and hybridization prediction // Nucleic Acids Research. — 2003. — V. 31. — N. 13. — P. 3406-3415.

14. Mathews D.H. Revolutions in RNA secondary structure prediction // Journal of Molecular Biology. — 2006. — V. 359. — N. 3. — P. 526-532.

15. Shi H., Moore P.B. The crystal structure of yeast phenylalanine tRNA at 1.93 A resolution:

a classic structure revisited // RNA. — 2000. — V. 6. — N. 8. — P. 1091-105.

16. Zhang J., Lin M., Chen R., Wang W., Liang J. Discrete state model and accurate estimation of loop entropy of RNA secondary structures // The Journal of Chemical Physics. — 2008. — V. 128. — N. 12. — P. 125107.

17. Eddy S.R. How do RNA folding algorithms work? // Nature Biotechnology. — 2004. — V. 22. — N. 11. — P. 1457-8.

18. Hofacker I., Fontana W., Stadler P., Bonhoeffer S., Tacker M., Schuster P. Fast folding and comparison of RNA secondary structures // Monatshefte fur Chemie. — 1994. — V. 125. — P. 167-188.

19. Eddy S.R. What is dynamic programming? // Nature Biotechnology. — 2004. — V. 22. — N. 7. — P. 909-10.

20. Rivas E., Eddy S.R. A dynamic programming algorithm for RNA structure prediction including pseudoknots // Jourmal of Molecular Biology. — 1999. — V. 285. — N. 5. — P. 2053-2068.

21. Ruan J., Stormo G.D., Zhang W. An iterated loop matching approach to the prediction of RNA secondary structures with pseudoknots // Bioinformatics. — 2004. — V. 20. — N. 1. — P. 58-66.

22. Миронов А. Метод поиска консервативных структур // Молекулярная биология. — 2007. — T. 41. — N. 4. — C. 711-18.

23. Anfinsen C.B. Principles that govern the folding of protein chains // Science. — 1973. — V. 181. — N. 4096. — P. 223-230.

24. Laing C., Schlick T. Computational approaches to 3D modeling of RNA // Journal of Physics: Condensed Matter. — 2010. — V. 22. — N. 28. — P. 283101.

25. Sato K., Kato Y., Hamada M., Akutsu T., Asai K. IPknot: fast and accurate prediction of RNA secondary structures with pseudoknots using integer programming // Bioinformatics. — 2011. — V. 27. — N. 13. — P. i85-i93.

26. Bon M., Orland H. Tt2ne: a novel algorithm to predict RNA secondary structures with pseudoknots // Nucleic Acids Research. — 2011. — V.39. — N. 14. — P. e93-e93.

27. Bon M., Micheletti C., Orland H. Mcgenus: a Monte Carlo algorithm to predict RNA secondary structures with pseudoknots // Nucleic Acids Research. — 2013. — V. 41. — N. 3. — P. 1895-1900.

28. Ambros V. Development: Dicing up RNAs // Science. — 2001. — V. 293. — N. 5531. — P. 811-813.

29. Eddy S.R. Computational genomics of noncoding RNA genes // Cell. — 2002. — V. 109.

— N. 2. — P. 137-140.

30. Gerlach W., Giegerich P. Guugle: a utility for fast exact matching under RNA complementary rules including G–U base pairing // Bioinformatics. — 2006. — V. 22. — N. 6. — P. 762-764.

31. Bernhart S. H., Tafer H., Muckstein U., Flamm C., Stadler P.F., Hofacker I.L. Partition function and base pairing probabilities of RNA heterodimers // Algorithms for Molecular Biology. — 2006. — V. 1. — N. 1. — P. 3-8.

32. Dirks R.M., Bois J.M., Schaeffer J.M., Winfree E., Pierce N.A. Thermodynamic analysis of interacting nucleic acid strands // Society for Industrial and Applied Mathematics Review. — 2007. — V. 49. — N. 1. — P. 65-88.

33. Busch A.. Richter A.S., Backofen R. IntaRNA: efficient prediction of bacterial sRNA targets incorporating target site accessibility and seed regions // Bioinformatics. — 2008.

— V. 24. — N. 24. — P. 2849-56.

34. Chitsaz H., Salari R., Sahinalp S.C., Backofen R. A partition function algorithm for interacting nucleic acid strands // Bioinformatics. — 2009. — V. 25. — N. 12. — P. i365 i373.

35. Higgs P.G. RNA secondary structure: a comparison of real and random sequences // Journal de Physique I. — 1993. — V. 3. — N. 1. — P. 43-59.

36. D. Ward. The RNA world / ed. by Gesteland R. F., Atkins J.F // New York: Spring Harbor Press, 1993. — 630 P.

37. Bundschuh R., Hwa T. RNA secondary structure formation: A solvable model of heteropolymer folding // Physical Review Letters. — 1999. — V. 83. — N. 7. — P. 1479 1482.

38. Bundschuh R., Hwa T. Statistical mechanics of secondary structures formed by random RNA sequences // Physical Review E. — 2002. — V. 65. — N. 3. — P. 031903.

39. Pagnani A., Parisi G., Ricci-Tersenghi F. Glassy transition in a disordered model for the RNA secondary structure // Physical Review Letters. — 2000. — V. 84. — N. 9. — P. 2026-2030.

40. Maier B., Bensimon D., Croquette V. Replication by a single DNA polymerase of a stretched single-stranded DNA // Proceedings of the National Academy of Sciences. — 2000. — V. 97. — N. 22. — P. 12002-12007.

41. Tamm M., Nechaev S.K. Unzipping of two random heteropolymers: Ground-state energy and finite-size effects // Physical Review E. — 2008. — V. 78. — N. 1. — P. 011903.

42. Chee M., Yang R., Hubbell E., Berno A., Huang X.C., Stern D., Winkler J., Lockhart D.J., Morris M.S., Fodor S.P.A. Accessing genetic information with highdensity DNA arrays // Science. — 1996. — V. 274. — N. 5287. — P. 610-614.

43. Gibbs R.A. DNA amplification by the polymerase chain reaction // Analytical Chemistry.

— 1990. — V. 62. — N. 13. — P. 1202-1214.

44. Valenzuela J.G., Francischetti I., Ribeiro J. Purification, cloning, and synthesis of a novel salivary anti-thrombin from the mosquito anopheles albimanus // Biochemistry. — 1999.

— V. 38. — N. 34. — P. 11209-11215.

45. Service R.F. DNA chips survey an entire genome // Science. — 1998. — V. 281. — N. 5380. — P. 1122a-1122a.

46. Marshall A., Hodgson J. DNA chips: An array of possibilities // Nature Biotechnology.

— 1998. — V. 16. — N. 1. — P. 27-31.

47. Krzakala F., Mezard M., Muller M. Nature of the glassy phase of RNA secondary structure // Europhysics Letters. — 2002. — V. 57. — N. 5. — P. 752-758.

48. Hui S., Tang L.H. Ground state and glass transition of the RNA secondary structure // The European Physical Journal B. — 2006. — V. 53. — N. 1. — P. 77-84.

49. Monthus C., Garel T. Directed polymer in a random medium of dimension 1+1 and 1+3:

weights statistics in the low temperature phase // Journal of Statistical Mechanics: Theory and Experiment. — 2007. — V. 2007. — P. 03011.

50. Lassig M., Wiese K.J. Freezing of random RNAs // Physical Review Letters. — 2006. — V. 96. — N. 22. — P. 228101.

51. David F., Wiese K.J. Systematic field theory of the RNA glass transition // Physical Review Letters. — 2007. — V. 98. — N. 12. — P. 128102.

52. Kardar M., Parisi G., Zhang Y.C. Dynamic scaling of growing interfaces // Physical Review Letters. — 1986. — V. 56. — N. 9. — P. 889-892.

53. Khanin K., Nechaev S.K., Oshanin G., Sobolevski A., Vasilyev O. Ballistic deposition patterns beneath a growing kardar-parisi-zhang interface // Physical Review E. — 2010.

— V. 82. — N. 6. — P. 061107.

54. Zee A. Random matrix theory and RNA folding // Acta Physica Polonica B. — 2005. — V. 36. — N. 9. — P. 2829-36.

55. Orland H., Zee A. RNA folding and large N matrix theory // Nuclear Physics B. — 2002.

— V. 620. — P. 456-476.

56. Bon M., Vernizzi G., Orland H., Zee A. Topological classification of RNA structures // Journal of Molecular Biology. — 2008. — V. 379. — N. 4. — P. 900-911.

57. Dumitriu I., Rassart E. Path counting and random matrix theory // Electronic Journal of Combinatorics. — 2003. — V. 10. — N. 1. — P. 43-59.

58. Edelman A., Rao N.R. Random matrix theory // Acta Numerica. — 2005. — V. 14. — N. 1. — P. 233-297.

59. Vernizzi G., Orland H., Zee A. Enumeration of RNA structures by matrix models // Physical Review Letters. — 2005. — V. 94. — N. 16. — P. 168103.

60. Mansfield M. Efficient knot group identification as a tool for studying entanglements of polymers // The Journal of Chemical Physics. — 2007. — V. 127. — N. 24. — P. 244901.

61. Ito J., Braithwaite D.K. Compilation and alignment of DNA polymerase sequences // Nucleic Acids Research. — 1991. — V. 19. — N. 15. — P. 4045.

62. D. K., and Ito J. Compilation, alignment, and phylogenetic relationships of DNA polymerases // Nucleic Acids Research. — 1993. — V. 21. — N. 4. — P. 787.

63. Needleman S. B., Wunsch C.D. A general method applicable to the search for similarities in the amino acid sequence of two proteins // Journal of Molecular Biology. — 1970. — V. 48. — N. 3. — P. 443-453.

64. Smith T. F., Waterman M.S. Identification of common molecular subsequences // Journal of Molecular Biology. — 1981. — V. 147. — P. 195-197.

65. Altschul S.F., Gish W., Miller W., Myers E.W., Lipman D.J. Basic local alignment search tool // Journal of Molecular Biology. — 1990. — V. 215. — N. 3. — P. 403-410.

66. Sankoff D. Simultaneous solution of the RNA folding. alignment and protosequence problems // Society for Industrial and Applied Mathematics: Journal on Applied Mathematics. — 1985. — V. 45. — N. 5. — P. 810-825.

67. Apostolico A., Guerra C. The longest common subsequence problem revisited // Algorithmica. — 1987. — V. 2. — N. 14. — P. 315-336.

68. Wagner R., Fischer M. The string-to-string correction problem // Journal of the Association for Computing Machinery. — 1974. — V. 21. — N. 1. — P. 168-173.

69. Gusfield D. Algorithms on strings, trees and sequences: computer science and computational biology // New York: Cambridge University Press, 1997. — 416 P.

70. Chvatal V., Sankoff D. Longest common subsequences of two random sequences // Journal of Applied Probability. — 1975. — V. 12. — N. 2. — P. 306-315.

71. Deken B. Some limit results for longest common subsequences // Discrete Mathematics.

— 1979. — V. 26. — N. 1. — P. 17-31.

72. Steele M.J. Long common subsequences and the proximity of two random strings // Society for Industrial and Applied Mathematics: Journal on Applied Mathematics. — 1982. — V. 42. — N. 4. — P. 731-737.

73. Dancik V., Paterson M. Upper bounds for the expected length of a longest common subsequence of two binary sequences // Random Structures and Algorithms. — 1995. — V. 6. — N. 4. — P. 449-58.

74. Alexander K.S. The rate of convergence of the mean length of the longest common subsequence // The Annals of Applied Probability. — 1994. — V. 4. — N. 4. — P. 1074 1082.

75. Kiwi M., Loebl M., Matouvsek J. Expected length of the longest common subsequence for large alphabets // Advances in Mathematics. — 2005. — V. 197. — N. 2. — P. 480-498.

76. Zhang M., Marr J.T. Alignment of molecular sequences seen as random path analysis // Journal of Theoretical Biology. — 1995. — V. 174. — N. 2. — P. 119-129.

77. Hwa T., Lassig M. Similarity detection and localization // Physical Review Letters. — 1996. — V. 76. — N. 14. — P. 2591-94.

78. Boutet de Monvel J. Extensive simulations for longest common subsequences // The European Physical Journal B. — 1999. — V. 7. — N. 2. — P. 293-308.

79. Waterman M.S., Vingron M. Sequence comparison significance and poisson approximation // Statistical Science. — 1994. — V. 9. — P. 367-381.

80. Drasdo D., Hwa T., Lassig M. Scaling laws and similarity detection in sequence alignment with gaps // Journal of Computational Biology. — 2000. — V. 7. — N. 12. — P. 115-141.

81. de Gennes P.G. Statistics of branching and hairpin helices for the dat copolymer // Biopolymers. — 1968. — V. 6. — N. 5. — P. 715-729.

82. Boutet de Monvel J. Mean-field approximations to the longest common subsequence problem // Physical Review E. — 2000. — V. 62. — N. 1. — P. 204-212.

83. Majumdar S.T., Nechaev S.K. Exact asymptotic results for the bernoulli matching model of sequence alignment // Physical Review E. — 2005. — V. 72. — N. 2. — P. 020901.

84. Kriecherbauer T., Krug J. A pedestrian’s view on interacting particle systems: KPZ universality and random matrices // Journal of Physics A: Mathematical and Theoretical.

— 2010. — V. 43. — N. 40. — P. 403001.

85. Ма Ш. Современная теория критических явлений // Москва: Мир, 1980. — 380 С.

86. Тамм М.В., Лисаченко Н.Г., Ерухимович И.Я., Иванов В.А. Эффекты конечного объема в системе равновесных циклических полимеров: теория и компьютерное моделирование // Высокомолекулярные соединения. — 2005. — T. 47. — N. 7. — C. 348-352.

87. Ландо К. Лекции о производящих функциях // Москва: Московский центр непре рывного математического образования, 2007. — 144 C.

88. Feller W. An introduction to probability theory and its applications. — V. 1. // New York:

Wiley, 1968. – 509 P.

89. Владимиров А.А. Паросочетания без пересечений // Проблемы передачи информа ции. — 2013. — T. 49. — N. 1. — С. 61-65.

90. Grimmett G. What is Percolation? // New York: Springer, 1999. — 444 P.

91. Tamm M., Nechaev S. Necklace-cloverleaf transition in associating RNA-like diblock copolymers // Physical Review E. — 2007. — V. 75. — N. 3. — P. 031904.

92. Toninelli C., Biroli G., Fisher D. Jamming percolation and glass transitions in lattice models // Physical Review Letters. — 2006. — V. 96. — N. 3. — P. 035702.

93. Shannon C.E., Weaver W. A mathematical theory of communication // The Bell System Technical Journal. — 1948. — V. 27. — P. 379-423.

94. Канторович В.Л. О перемещении масс // Доклады Академии Наук СССР. — 1942.

T. 37. — N. 3 — C. 227-229.

95. Кормен T.Х., Лейзерсон Ч.И., Ривест Р.Л., Штайн К. Алгоритмы: построение и анализ. 2-е изд. // Москва: Вильямс, 2006. — 1296 С.

96. Кузнецов В.А., Холод И.Н., Костевич С.Л. Руководство к решению задач по мате матическому программированию // Минск: Вышэйшая школа, 1978. — 128 C.

97. Schrijver A. Combinatorial Optimization - Polyhedra and Efficiency // New York:

Springer, 2003. — 632 P.

98. Delon J., Salomon J., Sobolevski A. Local matching indicators for transport problems with concave costs // Society for Industrial and Applied Mathematics: Journal on Discrete Mathematics. — 2012. — V. 26. — N. 2. — P. 801-827.

99. Mccann R.J. Exact solutions to the transportation problem on the line // Proceedings of the Royal Society A: Mathematical, Physical and Engineering Sciences. — 1999. — V. 455. — N. 1984. — P. 1341-1380.

100. Aggarwal A., Bar-Noy A., Khuller S. Kravets D., Schieber B. Efficient minimum cost matching using quadrangle inequality // Journal of Algorithms. — 1995. — V. 19. — N. 1.

— P. 116-143.

101. Postal M.P. Cross-over phenomena // New York: Rinehart and Winston, 1971. — 156 P.



Pages:     | 1 ||
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.