Как называется вторичная структура белка
Параграф 58. белки вторичная и третичная структура
Автор текста – Анисимова Елена Сергеевна.
Авторские права защищены. Продавать текст нельзя. Курсив НЕ НУЖНО зубрить.
Замечания можно присылать по почте: exam_bch@mail.ru
https://vk.com/bch_5
ПАРАГРАФ 58:
«ВТОРИЧНАЯ И ТРЕТИЧНАЯ СТРУКТУРА белков».
(См. сначала п.56 и п.57.)
Полипептидная цепь (ППЦ) способна формировать в пространстве определённую структуру за счёт взаимодействия атомов;
эти структуры получили название вторичной и третичной структуры (см. далее).
58.1. ВТОРИЧНАЯ СТРУКТУРА БЕЛКА.
Один из самых распространённых способов изменить конформацию и активность молекул белков – это присоединение и отщепление фосфатной группы. Эти реакции осуществляются под действием ферментов протеинкиназ и протеинфосфатаз (активность которых, в свою очередь, регулируется гормонами).
Присоединение фосфата меняет конформацию белковой молекулы потому, что фосфат имеет отрицательный заряд; присоединие фосфата приводит к тому, что к его отрицательному заряду притягиваются положительно заряженные радикалы, а отрицательно заряженные радикалы отталкиваются от отрицательного заряда фосфата.
Кратко – изменение конформации белка приводит к изменению активности белка (так как приводит к исчезновению или к появлению активного центра). Причиной изменений конформации белка является изменение условий среды, в которой находится белок, или изменение химического состава белка.
58.5. Денатурация. См. параграф 3.
Это потеря активности белка в результате разрушения третичной (или четвертичной) структуры. При этом ППЦ не разрушается, первичная структура сохраняется.
Почему происходит потеря активности – потому что при разрушении третичной структуры исчезают активные центры – из-за того, что отдаляются друг от друга РАДИКАЛЫ, формировавшие активный центр.
Под действием чего происходит денатурация и почему? – Под действием факторов, которые называют денатураторами. Примеры денатураторов:
ВЫСОКАЯ ТЕМПЕРАТУРА (нагревание; повышение температуры тела выше 37 градусов),
повышение или ПОНИЖЕНИЕ рН в результате появления кислот или щелочей (отклонение от оптимального для данного белка рН, который для большинства белков – около 7),
определённые излучения (например, РАДИАЦИЯ), определённые химические вещества, особенно гидрофобные, растворители и т.д.
Все денатураторы (например, высокая температура) ПОТЕНЦИАЛЬНО ОПАСНЫ для организма именно потому, что приводят к потере активности белков, что приводит к нарушению процессов в организме и гибели клеток.
При исчезновении денатурирующего фактора ППЦ иногда могут снова сформировать третичную структуру, что может привести к возвращению активности белка.
Строение и функции белков. Денатурация белка
Перед тем, как начать разбираться со строением белка и его функциями нужно кое-что прояснить. А что вообще такое белок? Как организм создает такое многообразие белков, если имеет ограниченный запас аминокислот?
Белок — это полимерная молекула, которая состоит из молекул поменьше — мономеров. Мономеры для белка — аминокислоты, которые соединяются между собой пептидными связями. Но здесь появляется вопрос, а сколько аминокислот нужно соединить между собой для того, чтобы получить белок? Больше 50. Если их будет меньше, то такая молекула называется пептид.
Все аминокислоты соединяются друг с другом в определенной последовательности, которая уникальна для каждого белка. Кто это контролирует? ДНК — ведь она и кодирует все эти аминокислоты. Ну а теперь можем начинать разбираться со структурой.
Первичная структура белка
Представляем себе огромную цепь, которая состоит из кучи звеньев. Такой же вид у первичной структуры белка — это просто полипептидная цепь, которая включает в себя аминокислоты. Их всего 20 штук. Но представьте себе сколько комбинаций можно сделать с этими 20 аминокислотами, соединяя их в разных последовательностях? Правильно, бесконечное множество.
Теперь посмотрим на молекулу поближе. Можно увидеть, что у этой большой молекулы есть свободная аминогруппа — N-конец, и свободная карбоксильная группа — C-конец. Молекулу всегда рисуют с N-конца и заканчивают C-концом.
Все остальные аминокислоты связаны друг с другом пептидной связью. Сумма всех пептидных связей — это пептидный остов. В него не входят радикалы, N-концы и C-концы. Будет понятнее, если я нарисую всё в одну линию.
В первичной структуре есть только пептидные связи
Важный момент! Первичная структура определяет какими будет вторичная, третичная и четвертичная (если такая есть) структуры. Это как мини-ДНК для белковой молекулы. Но я об этом еще напомню, даже несколько раз, вот такая я зануда.
Вторичная структура белка
Ну что, а теперь давайте усложнять все! Что можно сделать с цепью, которую мы рассмотрели до этого? Может закрутим цепь вокруг чего-то? Или просто растянем ее вдаль? Можно даже растянуть цепь и повернуть ее обратно, чтобы начало и конец были в одном месте. Что вам больше нравится?
Какой бы вариант не выбрали — он верный, но все зависит от того, какой тип вторичной структуры будет у белка. Напоминаю, что это определяется первичной :]
1. Альфа-спираль
Это для ребят, которые выбрали закрутить цепь вокруг чего-то. Правда закручивается она вокруг самой себя. В этой цепи происходит образование водородной связи между кислородом (карбоксильного атома углерода) и водородом (связан с азотом).
Далековато как-то. Как так выходит? Все из-за того, что происходит закручивание пептидного остова. Сделаем такую же картинку как сверху, но в виде атомов. Не забудем крутануть её немного…
Водородные связи в альфа-спирали
Каждый цвет — это остаток аминокислоты, только азоты и кислороды я оставил одного цвета, а то запутаемся ещё. Ещё альфа-углерод тут трех валентный и все атомы отмечать не стал, а то слишком громоздко получается. Думаю, что смысл понятен.
Какой сделаем вывод? Альфа-спираль похожа на корсет. Правда вместо него — водородные связи, которые стягивают её. Если присмотреться к радикалам, то они выглядывают как иголки из ёлки в разные стороны. Вот рисунок попроще.
Ой, а вы, наверное, ждали какой то супер крутой рисунок? А я тут такое подсунул, ладно держите вот немного получше. Правда он без радикалов и водородных связей. Но здесь лучше видно, что на один виток спирали приходится 3,6 аминокислотных остатка.
Альфа-спираль, конечно, очень красивый вариант, но он не всегда образуется. Есть аминокислоты, которые могут помешать этому:
Пролин. В его молекуле находится жесткое кольцо, которое всегда вызывает поворот. Такая уж у него структура. Если вставить его в альфа спираль, то произойдет поворот на 180 градусов. Ещё у пролина нет свободного водорода у азота. Получается, что он не может образовывать водородную связь, которая так важна для альфа-спирали.
Глицин. Если пролин слишком жесткий, то глицин, наоборот, очень гибкий. У него ведь нет радикала, поэтому если вставить слишком много глицинов, то прощай альфа-спираль. Иногда из-за него тоже происходит поворот молекулы на 180 градусов — прямо как на картинке выше.
Аминокислоты с большими радикалами. Большие радикалы круто, но если они будут расположены рядом, то это может помешать формированию альфа-спирали. Они просто мешают друг другу.
И последнее, одинаково заряженные аминокислоты. При одинаковом заряде они отталкиваются допустим: рядом расположены лизин и аргинин, или аспартат и глутамат. Ну и другие комбинации.
Если в полипептидной цепи много включений с такими радикалами, то чаще всего образуется…
2. Бета-складчатый слой
Здесь молекула будет похожа на лист, который состоит из нескольких тяжей. А они похожи на горки из игры Gravity defied. Хотя кому я это говорю….
Ладно, давайте просто посмотрим на рисунок, а лучше на два — один сбоку, а другой сверху. Что видим? Один тяж с горками, которые идут то вверх, то вниз. Радикалы аминокислот расположены над или под плоскостью листа.
Теперь можно составить из тяжей бета-складчатый слой. Здесь, как всегда, несколько вариантов. Первый вариант — параллельный лист, тогда направление тяжей одинаковое. Если оно разное, то он антипараллельный. Стабилизируется этот лист тоже с помощью водородных связей, прямо как альфа-спираль. Только вот есть один нюанс. Если в альфа-спирали есть четкая зависимость образования связей — через 4 аминокислотных остатка, то здесь такого нет. Например, водородными связями могут соединяться 5 остаток и 22.
Когда мы разбирали альфа-спираль, то сказали что пролин и иногда глицин вызывают поворот на 180 градусов. У этого есть свое название: бета-поворот.
3. Беспорядочный клубок
Это последний вариант. Здесь нет никаких спиралей или бета-складчатости, просто получается вот такая белиберда.
Что общего у всех вторичных структур? В их образовании участвует только пептидный остов. Радикалы пока что отдыхают. Ну и второе:
Водородные связи стабилизируют вторичную структуру
Ой, а от чего зависит какую вторичную структуру примет молекула?
А действительно, почему какая-то молекула принимает форму альфа-спирали, а другая бета-складчатости? Хороший вопрос, и у меня есть ответ на него: от торсионных углов. Я разбирал это в прошлой статье — кликай сюда, а потом возвращайся. Так, мы говорили о том, что углы бывают разными, но для каждой вторичной структуры характерны строго определенные углы. Есть специальные карты Рамачандрана, на которых указаны эти углы — все данные получены экспериментально.
Здесь можно посмотреть как будут выглядеть молекулы аминокислот с такими углами. Но вот вам фоточка, если лень.
Надеюсь, что теперь понятно почему и как формируется вторичная структура. Ах да, конечно же, все эти углы определяются первичной структурой!
Супервторичная
структура белка
До этого мы разбирали вторичные структуры изолированно, но представьте себе очень длинную полипептидную цепь. Не может же она вся закручиваться в альфа-спираль или становиться бета-складчатой. Хотя иногда и может, но об этом позднее. Чаще всего белок — это комбинация из альфа-спиралей, бета-тяжей и беспорядочных клубков. То есть может это выглядеть примерно вот-так.
Поймите, что супервторичная структура белка не стоит выше, чем вторичная. Это просто название, которое неправильно отражает суть, поэтому оно мне не нравится. На западе используют другое название — структурные мотивы, оно намного лучше. Вот в чем его суть: хоть у нас огромное количество самых разных белков, но в них есть определенные повторяющиеся паттерны — это и есть мотивы. Наиболее частые из них: бета-тяж + альфа-спираль + бета-тяж (бета-альфа-бета петля); альфа-спираль + бета-поворот + альфа-спираль; бета-бочонок.
Мотивов очень много, но думаю смысл понятен. Простые мотивы могут объединяться и образовывать мотивы посложнее.
Я использовал в иллюстрациях прошлые картинки, но помните, что эти альфа-спирали и бета-тяжи отличаются друг от друга аминокислотными остатками — они очень разные! Просто перерисовывать все это не хочется.
Третичная структура белка
Вот этот уровень уже повыше, на нем белок начинает выполнять свою функцию — впахивать, как проклятый. Но сначала нужно остановиться ненадолго и поговорить. Спокойно, я же сказал — ненадолго.
Согласитесь, что у белков очень много функций. Какой-то переносит кислород, а другой входит в состав кости и обеспечивает ее прочность. Белки мышечной ткани вообще обеспечивают движение. Давайте попробуем выделить две глобальные, но не совсем верные, функции: структурная и связывания. Одни белки входят в структуру мышц, костей, волос и так далее. А другие что-то связывают: ферменты связываются с субстратом, а гемоглобин с кислородом. А где-то бравое антитело падает на амбразуру для того, чтобы не пропустить бактерию в организм. Это конечно все очень грубо, но пусть будет так.
И все это я к чему. Существует два больших класса белков: фибриллярные — коллаген, эластин, кератин. Эти ребята занимаются поддержкой, такие вот суппорты. Фибрилла — это нить. Так что они очень длинные, а когда огромное количество нитей связывается в одну, то они становятся очень прочными. Фибриллярные белки — это атланты, которые держат наш организм на своих плечах. А мы не особо благодарные ребята, потому что забьем на них. Но только в этой статье.
В основном биохимия занимается другим классом — глобулярными белками. Эти ребята не только связывают — у них огромное количество функций. С этими функциями и пытается разобраться биохимия. Глобула — шар. Вроде это все, теперь можем приступать.
На прошлом этапе мы собрали разные вторичные структуры в мотивы, ну а дальше то что? Теперь нам нужно скрутить все это в компактный шарик — глобулу. Здесь, наконец-то, пригодятся наши лентяи — радикалы. Вспоминаем, что радикалы бывают полярные и неполярные. Когда глобула скручивается, то она прячет гидрофобные остатки аминокислот внутрь этого шарика, а гидрофильные выставляет наружу. Оно и понятно, все-таки глобулы находятся в организме, а у нас почти везде вода.
Скручивание — удивительный процесс. Здесь начинают взаимодействовать очень (очень-очень!) отдаленные аминокислотные остатки. Представьте, что тридцатый остаток взаимодействует с триста семидесятым. При этом все настолько предопределено первичной структурой, что радикалы взаимодействуют максимально точно. А взаимодействий ведь не мало!
Кстати о них, какими они бывают:
Про все эти связи у меня есть статейка ;] Ещё раз сказу, что здесь взаимодействуют только радикалы.
Когда глобула сложилась в пространстве, то всю эту сложную структуру называют конформацией (получается, что конформация — это положение атомов друг относительно друга в пространстве). Есть еще кое-что интересное: посмотрите на связи, которые образуют эту структуру. Большая часть из них — это силы слабого взаимодействия между молекулами. Это значит, что они очень легко рвутся, даже простого повышения температуры на несколько градусов хватит для того, чтобы эти связи разорвались. Как выйти из такого положения такой большой молекуле? Дело в том, что таких связей настолько много, что существует конформационная лабильность. По сути это означает, что некоторые связи могут рваться, а другие тут же образовываться.
Какой можно сделать вывод из всего этого? Не стоит думать о третичной структуре белка, как о чем-то статичном. Представьте ее как дом, который меняет свой цвет при повышении или понижении температуры, еще он может менять свой размер в зависимости от того идет дождь или нет. Какой странный дом…. В таком долго не проживешь.
Некоторые участки глобулы такие чсвшники, что собираются отдельно от всей остальной молекулы. Эти части называются доменами. Домен собирается в мини-третичную структуру самостоятельно, их даже может быть несколько. Чаще всего они имеют какую-то важную задачу, например, входят в состав активного центра.
Строение активного центра
Стоп-стоп-стоп. Это тиво еще такое? Ты про это ничего не говорил. Точно, помните мы сказали, что с этого уровня белок начинает пахать? А задача глобулы — это связать что-то, опять же грубо. Так вот, как она все это делает? Да-да, через активный центр, такие вы умные конечно… В чем прикол активного центра? Он должен соответствовать молекуле, с которой будет взаимодействовать. Это называется комплементарностью. Не путать с комплиментами.
Активный центр — это замок, а другая молекула — ключ, которые должны подходить друг другу. Такие вот соулмейты. Хотя к некоторым активным центрам могут подходить много ключиков. Связи, которые образуются в активном центре — слабые: чаще всего ионные, водородные и Ван-дер-Вальсовы. Но иногда могут быть и ковалентными, но не будем забегать вперёд — об этом мы поговорим, когда будем разбирать ферменты.
Ну а теперь, как все это работает. В активном центре располагается уникальная последовательность аминокислот, допустим там будет две положительнозаряженных и две отрицательнозаряженных аминокислоты. А у молекулы, с которой происходит взаимодействие, будет: две отрицательных группы и две положительных. Форма молекулы совпадает с формой активного центра. Кстати, у молекулы, которая взаимодействует с активным центром тоже есть свое название — лиганд. Надоели уже эти названия? Мне тоже…
Ах, да — вся третичная структура определяется первичной…. Я знаю, что вы запомнили, но хочу немного понадоедать.
5 типов связей стабилизируют третичную структуру: водородные, гидрофобные, Ван-дер-Вальсовы, ионные и дисульфидные. Эти связи образуются между радикалами.
Четвертичная структура белка
Последняя, но самая большая! Не пугайтесь, только по размеру. Она есть не у всех белков, некоторые прекрасно работают в виде третичной структуры и не парятся. Но представьте, что мы возьмем несколько третичных структур и как соединим их вместе. Пусть их будет 4 штуки, берем 4 шарика и соединяем их. Получаем четвертичную, но не из-за того, что мы взяли 4 шарика….
Эти шарики комплементарны друг другу в участках связывания — не активный центр, но чем-то похоже. Таких участков связывания много, поэтому ошибиться и не узнать своего товарища очень трудно.
Каждая глобула, которую мы взяли — это отдельная полипептидная цепь. Прочитай это еще раз. До этого все касалось только одной полипептидной цепи, а теперь их несколько. Такая цепь называется мономером (или субъединицей), а при соединении мономеров образуется олигомер. Так что вся большая молекула — это олигомер.
Какие связи все это стабилизируют? Чаще всего это водородные, ионные и Ван-дер-Вальсовы, так как каждый мономер прячет свои гидрофобные остатки вглубь молекулы, то они образуются редко. Получается, что четвертичную структуру стабилизируют силы слабого взаимодействия, ковалентных связей здесь почти никогда не бывает — очень редко могут быть дисульфидные. Поэтому можем спокойно забить на них.
В чем отличие четвертичной структуры от третичной? Ну кроме того, что тут объединено несколько полипептидных цепей. А вот какое — у олигомерных белков есть не только активный центр, но и другой — аллостерический центр. К этому замку не подойдут лиганды от активного центра, у него есть свои собственные ключики. Это очень важно, нужно запомнить! Господи, я превращаюсь в препода….
Проведем аналогию с нашим домиком, только теперь их будет несколько. У каждого будет по главному и черному входу! Главный вход — активный центр, а черный ход — это аллостерический центр.
Аллострические центры дают кое-что важное — регуляцию. Маленькая молекула, которая соединится с аллостерическим центром может остановить работу целого огромного белка. Круто? Получается, что размер не важен — не удержался.
Но каким образом одна молекула останавливает работу целого белка? Очень просто — хотел бы я так сказать. Присоединение молекулы к мономеру изменяет его конформацию. А это ведет к тому, что мономер изменяет конформацию других мономеров — происходят конформационные изменения всей структуры белка. В результате этих изменений закрывается активный центр — лиганд не может к нему подойти. У всех этих изменений есть, как и всегда, свое название — кооперативный эффект.
И опять я про дом, если открыть черный ход, то нельзя открыть главный вход, ну и наоборот. Не всегда регуляция работает в таком ключе: черный ход может, наоборот, открывать парадную дверь. Но сейчас это не суть, главное понять смысол. Кстати, на самом деле чаще одна субъединица несет на себе аллостерический центр, а другая активный. Я решил запихнуть все в одну — думаю, что так будет нагляднее.
Кроме этого, присоединение к активному центру также изменяет конформацию остальных мономеров, что приводит к облегченному присоединению лигандов. Хоть на картинке этого и не видно, но поверьте на слово!
В четвертичной структуре взаимодействуют несколько полипептидных цепей!
Стабилизируется молекула силами слабого взаимодействия.
Давайте заканчивать уже со строением.
Простые и сложные белки
До этого мы говорили, что белок — это полипептидная цепь, которая что-то там делает. Иногда даже несколько цепей соединяются и образуют олигомер. Но мы кое-что упускали все это время. Ведь не все белки состоят только из полипептидных цепей. У гемоглобина есть гем, а это не белковая часть, ого! Белки, которые располагаются на поверхности мембран соединяются с углеводами, которые спасают их от разрушения.
Получается, что у некоторых белков есть дополнительные компоненты. Есть простые белки — они состоят только из аминокислотных остатков, а есть белки сложные. Они включают в себя белковую часть (апопротеин), и небелковую (простетическая группа). Простетические группа связана с белком с помощью ковалентных связей — просто так её не оторвёшь. Она очень важна, потому что белки без неё уже не могут работать. Простетических групп очень много — это могут быть металлы, углеводы, гем, липиды и еще куча всего. Но это так, для общего развития.
У нас осталось последнее.
Денатурация белка
Так долго мы добирались до четвертичной структуры, но теперь время все УНИЧТОЖИТЬ. Денатурация — это потеря функции белка, через разрушение его четвертичной, третичной и вторичной структуры. Но не первичной! Процесс может остановиться и раньше, не дойдя до первичной. Но самое важное — белок перестает работать. Это значит вот что: если у белка есть только третичная структура, то её потеря приведёт к потере функций. Тоже самое касается белков с четвертичной структурой.
Денатурирующие факторы делятся на физические и химические.
Физические факторы
У всех этих факторов общий механизм действия. Они вносят в систему дополнительное количество энергии. Это вызывает увеличение амплитуды колебательных движений фрагментов полипептидной цепи. Из-за этого рвутся слабые связи, стабилизирующие белковую молекулу — водородные, гидрофобные и Ван-дер-Вальсовы. Вот некоторые из этих факторов:
Химические факторы
Химические денатурирующие факторы различаются по механизму действия. Так что разбираемся с каждым отдельно. Представим, что мы рвём каждую связь:
1) Добавим кислоту или щелочь в раствор, где находится белок — произойдет изменение заряда некоторых аминокислот. Раз изменился заряд, то происходит разрушение водородных и ионных связей.
2) Детергенты — это вещества, у которых есть гидрофобные и гидрофильные участки. Если засунуть их внутрь молекулы, то гидрофобное взаимодействие нарушится. Примеры детергентов — фенолы, додецилсульфат.
3) С помощью тяжелых металлов мы порвем дисульфидные мостики в третичной структуре. Такими тяжелыми металлами будут: свинец, медь и ртуть.
4) Восстанавливающие агенты — восстанавливают дисульфидные связи. Смысл такой же, как и с тяжелыми металлами: разрушение дисульфидных мостиков. Пример — меркаптоэтанол.
5) Вещества, образующие водородные связи — мочевина. Это ужасная воровка, она перетягивает водородные связи с белка на себя.
Но, мы сказали, что это разрушает вторичную, третичную и четвертичную структуры, но не первичную. Она остается целой. А так как она отвечает за формирование всех остальных, то при удалении денатурирующего фактора белок может снова стать работоспособным, восстановив свою структуру. Это процесс называется ренативация белка. Для этого нужны определённые условия, но они не всегда достижимы в клетке. Поэтому для большинства белков денатурация — это необратимый процесс.
Хочешь задать вопрос, похвалить или наговорить гадостей? Тогда залетай в телегу. Там ты сможешь предложить новый формат или разбор темы. А если серьёзно, то эти статьи пишутся для вас, поэтому мне важна обратная связь.
Структура белка: введение для айтишников
1. Почему белки важны?
Как сказал Фридрих Энгельс, “Жизнь есть способ существования белковых тел”. В 19 веке еще не знали о роли ДНК в наследовании генетической информации, но утверждение дяди Фридриха в значительной мере справедливо до сих пор – основную работу в наших клетках совершают именно белки. Это и поддержание структуры (формы клеток), и химический катализ, и моторная функция (сокращение мышц, например), и транспорт (скажем, белок гемоглобин переносит кислород из легких в ткани и углекислый газ в обратном направлении) и сложные регуляторные функции по поддержанию постоянства внутренней среды (скажем, белковые гормоны и всякие внутриклеточные регуляторные системы) и многие другие. Словом, если в нашем организме что-то происходит, в это обязательно вовлечены белки (хотя и не только они).
2. Что такое белок?
С химической точки зрения белок – это линейный (неветвящийся) полимер, состоящий из монотонно повторяющихся одинаковых блоков «основной цепи», к которым приделаны различные «боковые группы». Так как блоки основной цепи несимметричны, вся полипептидная цепь белка имеет направление, различают N- и C-конец полипептидной цепи.
Длина цепи – от 70 до более чем 1000 мономеров (аминокислотных остатков), средняя длина для высших организмов – примерно 500-600 аминокислотных остатков, для бактерий эта величина будет меньше, скорее 300-400 остатков. Всего в природе существует 20 стандартных аминокислот, одинаковых и для бактерии и для человека, то есть из основной цепи могут торчать 20 разных боковых групп.
(Тут возможна поправка – некоторые химические группы могут быть модифицированны после синтеза белка, например, фосфорилированы. Однако это не рассматривается как другая аминокислота, а рассматривается как продукт модификации исходной. Так же у высших организмов возможно встраивание двух неканонических аминокислот, но это редкое событие. То есть, строго говоря, разных аминокислот 22, из них 20 основных и 2 редкие, плюс некоторые боковые группы могут быть изредка химически модифицированы).
Из поколения в поколение генетическая информация передается в виде ДНК, в ней есть так называемые «белок-кодирующие области». В этих местах ДНК однозначным образом (для ботанов – с точностью до альтернативного сплайсинга и редактирования РНК) закодирована информация о линейной последовательности аминокислот для синтеза данного белка, плюс в клетке есть соответствующие машины, способные синтезировать белок по информации, изначально закодированной в ДНК.
Так как белок – линейный полимер, собранный из 20 стандартных мономеров, его так называемую «первичную структуру» легко представить в виде строки, например так:
Это аминокислотная последовательность маленького человеческого белка в формате FASTA, первая строчка, начинающаяся с «>», описывает его название, после чего следует последовательность аминокислот в соответствии со стандартной кодировкой (например, М –метиони, S – серин и тд, всего 20 букв стандартного однобуквенного кода), слева – N-конец белка, справа – его С-конец. Для разных белков длина строки будет очевидно разной, так как белки имеют разную длину. Последовательности всех известных белков можно найти в открытом доступе здесь: www.ncbi.nlm.nih.gov
3. Структура белка
Хорошо, с первичной структурой разобрались, но разве белок работает в развернутом линейном виде? Конечно нет. Тут надо заметить, что со структурной точки зрения есть разные классы белков: глобулярные, мембранные и фибриллярные. Мембранные белки, как следует из названия, живут только в клеточных мембранах, для стабилизации их структуры нужно особое окружение мембраны, мы не будем их рассматривать в этом обзоре. Фибриллярные белки имеют простое регулярное строение, похожи на вытянутые волокна, они не растворимы в воде и выполняют структурные функции (например, из кератина состоят волосы, к фибриллярным белкам относится белок из натурального шёлка). Недавно стали выделять класс разупорядоченных белков – белков, не обладающих постоянной трехмерной структурой, либо приобретающих ее только на короткое время при взаимодействии с другими белками. Наиболее интересный с практической точки зрения класс белков, который мы и будем рассматривать – глобулярные водорастворимые белки, к этому классу относится большинство белков.
Линейная полипептидная цепь в воде способна самопроизвольно сворачиваться в сложную трехмерную структуру (глобулу) и только в таком свернутом виде белки могут выполнять химический катализ и прочую интересную работу. Поэтому нам принципиально важно знать именно трехмерную укладку белка, так как только на этом уровне становится понятно, как белок работает.
Вопрос: сколько трехмерных структур соответствует конкретному белку?
Ответ: Одна, с точностью до небольшой подвижности маленьких «разупорядоченных» петель. Известно ровно одно исключение, когда одной последовательности соответствуют 2 достаточно разные структуры, это прионы.
Вопрос: Почему у белка только одна трехмерная структура?
Ответ: для химического катализа нам нужно расположить соответствующие химические группы строго определенным образом в пространстве. Для этого нужна жесткая структура. То есть весь белок должен быть жестким, чтобы поддерживать химические группы аминокислот активного центра в нужных местах (в реальности многие белки состоят из двух и более жестких частей, которые могут двигаться друг относительно друга, это нужно для регуляции активности белка (аллостерическая регуляция), чтобы некий сигнал мог включать и выключать химическую активность белка-фермента). Чтобы структура была жесткой и стабильной, природа позаботилась о том, чтобы структура каждого белка соответствовала энергетическому минимуму данной системы атомов и этот минимум был настолько глубоким, чтобы белок из него не «выпрыгнул». Все другие, паразитные структуры, обладают большей энергией и белок все равно сваливается в энергетический минимум, соответствующий нативной структуре.
Вопрос: на чем держится трехмерная структура белка?
Ответ: если коротко, то в основном на большом количестве нековалентных взаимодействий. В принципе, химические группы белка могут образовывать: (1) водородную связь, эти группы есть и в основной цепи и у некоторых боковых групп, (2) ионную связь – электростатическое взаимодействие между разноименно заряженными боковыми группами, (3) Ван-дер-Ваальсово взаимодействие и (4) гидрофобный эффект, на котором держится общая структура белка. Суть в том, что в белке всегда есть гидрофобные ароматические остатки, им энергетически невыгодно контактировать с полярными молекулами воды, а выгодно «слипнуться» друг с другом. Таким образом, при сворачивании белка гидрофобные группы выталкиваются из водного окружения, «слипаясь» друг с другом и формируя «гидрофобное ядро», а полярные и заряженные группы, наоборот, стремятся в водное окружение, формируя поверхность белковой глобулы. Так же (5) боковые группы двух остатков цистеина могут образовать между собой дисульфидный мостик – полноценную ковалентную связь, жестко фиксирующую белок.
Соответственно, все аминокислоты делятся на гидрофобные, полярные (гидрофильные), положительно и отрицательно заряженные. Плюс цистеины, способные образовывать ковалентную связь между собой. Особыми свойствами обладают глицин – у него отсутствует боковая группа, сильно ограничивающая конформационную подвижность других остатков, поэтому он может очень сильно «гнуться» и находится в местах, где белковую цепь надо развернуть. У пролина же, наоборот, боковая группа образует кольцо, ковалентно связанное с основной цепью, жестко фиксируя ее конформацию. Пролины встречаются там, где надо сделать белковую цепь жесткой и негнущейся. Многие заболевания связаны с мутацией пролина на глицин, из-за чего структура белка слегка «плывет».
Вопрос: откуда вообще мы знаем о трехмерных структурах белка?
Ответ: из эксперимента, это абсолютно надежные данные.
Сейчас есть 3 метода для экспериментального определения структуры белка: ядерно-магнитный резонанс (ЯМР), cryo-EM (электронная микроскопия) и рентгеноструктурный анализ кристаллов белка.
ЯМР позволяет определить структуру белка в растворе, но он работает только для очень маленьких белков (для больших невозможно сделать деконволюцию).
Этот метод был важен для общего доказательства того, что у белка только одна трехмерная структура и что структура белка в кристалле идентична структуре в растворе. Это очень дорогой метод, так как требуется получить белок с изотопными метками.
Cryo-EM заключается в простой заморозке раствора белка и микроскопии. Минус метода – низкое разрешение (видна лишь общая форма молекулы, но не видно, как она устроена внутри), плюс плотность белка близка к плотности воды/растворителя, поэтому сигнал тонет в высоком уровне шума. В этом методе активно применяются компьютерные технологии работы с картинками и статистика для вытягивания сигнала из шума.
Отбираются миллионы картинок молекул белка, проводится разделение на классы в зависимости от ориентации молекулы относительно подложки, усреднение по классам, генерация eigenimages, новый раунд усреднения и так пока не сойдется. Потом из информации из разных классов можно восстановить трехмерный вид молекулы с низким разрешением. Если же есть внутренняя симметрия частиц (например, при cryo-EM анализе вирусов), то можно еще каждую частицу поусреднять в соответствии с операторами симметрии – тогда разрешение будет еще лучше, но хуже, чем в случае рентгеноструктурного анализа.
Рентгеноструктурный анализ – основной способ определения структур белка. Главный плюс – потенциально можно получить кристаллы даже очень больших комплексов из многих десятков белков (например, именно так была определена структура рибосомы – Нобелевская премия 2009 года). Минус метода – вначале нужно получить кристалл белка, но далеко не каждый белок хочет кристаллизоваться.
Зато после того, как кристалл получен, по дифракции рентгеновского излучения можно однозначно определить положения всех (упорядоченных) атомов в молекуле белка, этот метод дает самое высокое разрешение и позволяет в лучших случаях видеть позиции отдельных атомов. Было доказано, что структура белка в кристалле однозначно соответствует структуре в растворе.
Сейчас действует конвенция – если ты определил структуру белка любым из экспериментальных физических методов, структура должна быть помещена в открытый доступ в банк данных белковых структур (Protein Data Bank – PDB, www.pdb.org ), в настоящее время там находится более 90 000 структур (впрочем, многие из них повторяющиеся, например, комплексы одного и того же белка с разными малыми молекулами, такими, как лекарственные средства). В PDB все структуры лежат в стандартном формате, называющемся, внезапно, pdb. Это текстовый формат, в котором каждому атому структуры соответствует одна строчка, в которой указан номер атома в структуре, название атома (углерод, азот и тд), название аминокислоты, в которую входит атом, название цепи белка (A, B, C и тд, если это кристалл комплекса из нескольких белков), номер аминокислоты в цепи и трехмерные координаты атома в ангстремах относительно ориджина, плюс так называемые температурный фактор и заселённость (это сугубо кристаллографические параметры).
Далее есть специальные программы, которые по данным из этого текстового файла могут графически отображать красивую трехмерную структуру молекулы белка, которую можно покрутить на экране монитора и, как говорил Гай Додсон, «дотронуться мышкой до молекулы» (например, PyMol, CCP4mg, старый RasMol). То есть смотреть на структуры белка просто – ставишь программу, загружаешь нужную структуру из PDB и наслаждаешься красотой природы.
4. Анализируем структуру
Итак, мы поняли основную идею: белок — линейный полимер, сворачивающийся в водном растворе под действием множества слабых взаимодействий в стабильную и единственную для данного белка трехмерную структуру, и способный в таком виде выполнять свою функцию. Различают несколько уровней организации белковых структур. Выше мы уже познакомились с первичной структурой – линейной последовательностью аминокислот, которую можно выписать в строчку.
Вторичная структура белка определяется взаимодействием атомов основной цепи белка. Как уже было сказано выше, в состав основной цепи белка входят доноры и акцепторы водородной связи, таким образом, основная цепь может приобретать некоторую структуру. Точнее, несколько разных структур (детали все-таки зависят от различающихся боковых групп), так как возможно образование разных альтернативных водородных связей между группами основной цепи. Структуры бывают такие: альфа-спираль, бета-листы (состоящие из нескольких бета-тяжей), которые бывают параллельными и анти-параллельными, бета-поворот. Плюс часть цепи может и не иметь выраженной структуры, например в районе поворота петли белка. Эти типы структур имеют свои устоявшиеся схематичные обозначения – альфа-спираль в виде спирали или цилиндра, бета-тяжи в виде широких стрелок. Вторичную структуру удается достаточно достоверно предсказывать по первичной (стандартом является JPred), альфа-спирали предсказываются наиболее точно, с бета-тяжами бывают накладки.
Третичная структура белка определяется взаимодействием боковых групп аминокислотных остатков, это и есть трехмерная структура белка. Можно представить себе, что вторичная структура сформирована и теперь эти спирали и бета-тяжи хотят уложиться все вместе в компактную трехмерную структуру, чтобы все гидрофобные боковые группы спокойно «слиплись» вместе в глубине белковой глобулы, сформировав гидрофобное ядро, а полярные и заряженные остатки торчали наружу в воду, формируя поверхность белка и стабилизируя контакты между элементами вторичной структуры. Третичную структуру изображают схематически несколькими способами. Если просто отрисовать все атомы, то получится каша (хотя когда мы анализируем активный центр белка, то мы хотим смотреть как раз на все атомы активных остатков).
Если мы хотим посмотреть, как устроен весь белок в общем, можно отобразить только некоторые атомы основной цепи, чтобы увидеть ее ход. Как вариант, можно нарисовать красивую схему, где поверх реального расположения атомов схематично нарисованы элементы вторичной структуры – так с первого взгляда видна укладка белка. После изучения всей структуры в общем, схематичном виде, можно отобразить химические группы активного центра и уже сосредоточиться на них. Задача предсказания третичной структуры белка – нетривиальная и в общем случае не решается, хотя может быть решена в частных случаях. Подробнее – ниже.
Четвертичная структура белка – да, есть и такая, правда не у всех белков. Многие белки работают сами по себе (мономеры, в данном случае под мономером имеется в виду одиночная свернутая полипептидная цепь, то есть белок целиком), тогда их четвертичная структура равна третичной. Однако достаточно много белков работает только в комплексе, состоящем из нескольких полипептидных цепей (субъединиц или мономеров — димеры, тримеры, тетрамеры, мультимеры), тогда вот такая сборка из нескольких отдельных цепей и называется четвертичной структурой. Самый банальный пример – состоящий из 4 субъединиц гемоглобин, самый красивый на мой взгляд пример – состоящий из 11 одинаковых субъединиц бактериальный белок TRAP.
5. Вычислительные задачи
Белок – сложная система из тысяч атомов, поэтому без использования компьютеров в структуре белка не разобраться. Задач, как решенных на приемлемом уровне, так и совсем не решенных, множество. Перечислю наиболее актуальные:
На уровне первичной структуры – поиск белков с похожей аминокислотной последовательностью, построение по ним эволюционных деревьев и тд – классические задачи биоинформатики. Главным хабом является NCBI — The National Center for Biotechnology Information, www.ncbi.nlm.nih.gov. Для поиска белков со сходной последовательностью стандартно используется BLAST: blast.ncbi.nlm.nih.gov/Blast.cgi
Предсказание растворимости белка. Речь идет о том, что если мы прочитаем геном какого-нибудь животного, определим по нему последовательности белков, переклонируем эти гены в кишечную палочку или baculovirus expression system, то окажется, что при экспрессии в этих системах примерно треть белков не будет сворачиваться в правильную структуру, и, как следствие, будет нерастворима. Тут выясняется, что большие белки на самом деле состоят из отдельных «доменов», каждый из которых представляет автономную, функциональную часть белка (несущую одну из его функций) и часто «вырезав» из гена отдельный домен, можно получить растворимый белок, определить его структуру и провести с ним опыты. Люди пытаются использовать машинное обучение (нейронные сети, SVM и прочие классификаторы), чтобы предсказывать растворимость белка, однако работает оно достаточно плохо (Гугл много чего покажет по запросу “protein solubility prediction” – есть много серверов, но по моему опыту все они работают отвратительно на моих белках). В идеале я хотел бы видеть сервис, который надежно сказал бы, где в белке находятся те самые растворимые домены, чтобы их можно было вырезать и работать с ними – такого сервиса нет.
На уровне вторичной структуры – предсказание той самой вторичной структуры по первичной (JPred)
На уровне третичной структуры – поиск белков со сходными трехмерными структурами (DALI, en.wikipedia.org/wiki/Structural_alignment ),
Поиск структур по заданной суб-структуре. Например, у меня есть расположение трех аминокислот активного центра в пространстве. Хочу найти структуры, которые содержать такие же три аминокислоты в таком же относительном расположении, либо найти структуры белков, мутирование которых даст возможность расположить нужные аминокислоты нужным образом. (гуглить «protein substructure search»)
Предсказание потенциальной подвижности трехмерной структуры, возможных конформационных изменений – normal mode analysis, ElNemo.
На уровне четвертичной структуры – предположим, известны структуры двух белков. Известно, что они образуют комплекс. Предсказать структуру комплекса (определить, как эти два белка будут взаимодействовать посредством shape matching, например). Гуглить «protein-protein docking»
6. Предсказание структуры белка
Выделил эту вычислительную задачу в отдельный раздел, ибо велика она, фундаментальна и не решается в общем случае.
Экспериментально мы знаем, что если взять белок, полностью развернуть его и бросить в воду, то он свернется обратно в исходное состояние за время от миллисекунд до секунд (это утверждение справедливо по крайней мере для небольших глобулярных белков без всяких патологий). Это значит, что вся информация, необходимая для определения трехмерной структуры белка, в неявном виде содержится в его первичной последовательности, поэтому так хочется научиться предсказывать трехмерную структуру белка по последовательности аминокислот in silico! Однако эта задача в общем случае не решена до сих пор. В чем же дело? Дело в том, что в первичной последовательности отсутствует в явном виде информация, необходимая для построения структуры. Во-первых, нет информации о конформации основной цепи – а она обладает значительной подвижностью, хотя и несколько ограниченной по стерическим причинам. Плюс каждая боковая цепь каждой аминокислоты может находиться в разных конформациях, для длинных боковых групп типа аргинина, это может быть больше десятка конформаций.
Что же делать? Есть достаточно известный хабравчанам самый общий подход, называемый «молекулярная динамика» и подходящий для любых молекул и систем. Берем развернутый белок, приписываем всем атомам случайные значения скоростей, считаем взаимодействия между атомами, повторяем до тех пор, пока система не придет в стабильное состояние, соответствующее свернутому белку. Почему это не работает? Потому что современные вычислительные мощности позволяют за месяцы работы кластера считать десятки наносекунд для системы из тысяч атомов, какой является белок, помещенный в воду. Время же сворачивания белка – миллисекунды и больше, то есть вычислительных мощностей не хватает, разрыв – в несколько порядков. Впрочем, пару лет назад американцы совершили некоторый прорыв. Они использовали специальное железо, оптимизированное для векторных вычислений и после оптимизации на аппаратном уровне у них за месяцы работы машины получилось посчитать молдинамику до миллисекунд для очень маленького белка и белок свернулся, структура соответствовала экспериментально определенной ( http://en.wikipedia.org/wiki/Anton_(computer) )! Однако праздновать победу еще рано. Они взяли очень маленький (его размер раз в 5-10 меньше среднего белка) и один из самых быстросворачивающихся белков, классический модельный белок, на котором изучалось сворачивание. Для больших белков время расчетов увеличивается нелинейно и потребуются уже годы, то есть еще есть над чем работать.
Другой подход реализован в Rosetta. Они разбивают последовательность белка на очень короткие (3-9 остатков) фрагменты и смотрят, какие конформации для этих фрагментов присутствуют в PDB, после чего запускают Монте-Карло по всем вариантам и смотрят, что получится. Иногда получается что-то годное, но в моих случаях через несколько дней работы кластера получаешь такой бублик, что возникает немой вопрос: «Кто писал их оценочную функцию, ставящую какую-то хорошую оценку вот этой загогулине?».
Есть инструменты и для моделирования вручную – можно предсказать вторичную структуру и попробовать вручную крутить ее, находя лучшую укладку. Некие гениальные люди даже выпустили игрушку FoldIt, представляющую белок схематично и позволяющую укладывать его, как-бы собирая головоломку (для интересующихся структурой – рекомендую!). Есть абсолютно официальное соревнование для предсказателей белковых структур, называемое CASP. Суть в том, что когда экспериментаторы определяют новую структуру белка, не имеющую аналогов в PDB, они могут не выкладывать ее сразу в PDB, а выставить последовательность этого белка на конкурс предсказаний CASP. Через некоторое время, когда все закончат свои предсказательные модели, экспериментаторы выкладывают свою экспериментально определенную структуру белка и смотрят, насколько хорошо сработали предсказатели. Самое интересное, что игроки FoldIt, не будучи учеными, как-то выиграли CASP у профессионалов моделирования белковых структур и предсказали структуру белка точнее. Однако даже эти успехи не позволяют утверждать, что проблема предсказания структуры белка решается – очень часто модель очень далека от реальной структуры.
Все это относилось к моделированию белков ab initio, когда нет никакой априорной информации о структуре. Однако очень часто бывают ситуации, когда для некоторого белка в PDB присутствует его отдаленный родственник с уже известной структурой. Под родственником подразумевается белок с похожей первичной последовательностью. Считается, что для белков со сходством по первичной последовательности больше 30% одинаковая укладка основной цепи (хотя одинаковая укладка наблюдалась и для белков, не проявляющих никакого статистически достоверного сходства по первичной последовательности). В случае наличия гомолога (похожего белка) с известной структурой, можно сделать «гомологичное моделирование», то есть попросту «натянуть» последовательность твоего белка на известную структуру гомолога, а потом погонять минимизацию энергии, чтобы как-то все это дело утрясти. Такое моделирование показывает хорошие результаты при наличие очень близких гомологов, чем дальше гомолог – тем больше ошибка. Инструменты для гомологичного моделирования – Modeller, SwissModel.
Можно решать и другие задачи, например, пытаться моделировать, что произойдет, если внести в белок ту или иную мутацию. Например, если заменить гидрофильную аминокислоту на поверхности белка на другую гидрофильную, то скорее всего структура белка не изменится вообще. Если заменить аминокислоту из гидрофобного ядра на другую гидрофобную, но другого размера, то скорее всего укладка белка останется той же, но слегка «съедет» на доли ангстрема. Если же заменить аминокислоту из гидрофобного ядра на заряженную, то скорее всего белок просто «взорвется» и не сможет свернуться.
Может показаться, что все не так уж и плохо и мы достаточно хорошо пониманием сворачивание белка. Да, мы понимаем кое-что, например до некоторой степени мы понимаем общие физические принципы, лежащие в основе сворачивания полипептидной цепи – они рассматриваются в замечательном учебнике Птицына и Финкельштейна «Физика белка». Однако это общее понимание не позволяет нам ответить на вопросы «Свернется ли данный белок или не свернется?», «Какая структура будет у этого белка?», «Как сделать белок с желаемой структурой?».
Вот одна из иллюстраций: мы хотим локализовать один из доменов большого белка, это стандартная задача. У нас есть фрагмент, который сворачивается и растворим, то есть это живой и здоровый белок. Мы же хотим найти его минимальную часть и начинаем методами генетической инженерии с обоих концов удалять по 2-3 аминокислоты, экспрессировать такой обрезанный белок в бактерии и смотреть его сворачиваемость экспериментально. Мы делаем десятки конструкций с такими маленькими делециями и видим такую картину – полностью растворимый и живой белок отличается от полностью мертвого и несворачивающегося на 3 аминокислоты. Повторюсь, это объективный экспериментальный результат. Проблема в том, что сейчас не существует вычислительного метода, который предсказал бы сворачиваемость белка хотя бы на уровне «да/нет» и сказал мне, где проходит граница между сворачивающимся и несворачивающимся белком, потому мы вынуждены клонировать и экспериментально проверять десятки вариантов. Это лишь одна из иллюстраций того, что наше понимание структуры белка весьма далеко от совершенства. Как говорил Ричард Фейнман, «Чего не могу воссоздать, того не понимаю».
Так что, господа программисты, физики и математики, нам еще есть над чем работать.
На этой оптимистичной ноте разрешите откланяться, благодарю всех, кто осилил сей опус.