Протеомика структурная и функциональная статьи. Методическое пособие. Протеомные исследования в биологии и медицине. Методы и основные задачи протеомики

Методическое пособие

Протеомные исследования в биологии и медицине

План:

Введение

Протеомика в биологии

Протеомика в медицине

Заключение, перспективы

Введение

Термин «протеом», обозначает весь белковый комплемент, экспрессируемый геномом – “PROTEOME: entire PROTEin complement expressed by genOME”. Протеомика – это системное изучение «протеома», то есть всех белков, синтезирующихся в клетке или другом объекте (органе, организме). Высокая значимость каждого из индивидуальных белков для обеспечения тех или иных функций и/или молекулярных структур в организме не только определяет их вовлеченность в различные физиологические и патологические процессы с потенциальными возможностями для использования белков в качестве эффективных диагностических маркеров, но и для применения некоторых белков как лекарственных средств. Для обнаружения и исследований новых белков широко применяются новые технологии , которые после завершения международного проекта «Геном человека» принято называть постгеномными. В частности, для системных исследований информационных РНК (транскриптов) используют термин «транскриптомика», а для системных исследований белков – «протеомика». Освоение и использование геномных и постгеномных технологий позволяет вывести молекулярно-биологические исследования, направленные на решение медицинских вопросов, на качественно более высокий уровень.

Традиционные подходы к изучению индивидуальных белков – биохимический и иммунохимический ориентируются на последовательное изучение отдельных белков. Для достижения цели белки изучают (выделяют), используя их индивидуальные свойства – функциональную активность или антигенность . В тоже время, системный подход ориентируется на параллельное изучение многих индивидуальных белков, совокупность которых составляет определенную систему, что характеризует исследуемый объект в целом. Рисунок 1 демонстрирует различие в разрешающей способности между одномерным электрофорезом (разделение смеси белков по разнице в их молекулярных массах) и комплексным методом – двумерным электрофорезом. Двумерный электрофорез в состоянии выявить в несколько раз больше индивидуальных белков, по сравнению с одномерным.

53" height="32" style="vertical-align:top">

https://pandia.ru/text/78/543/images/image003_59.gif" width="392" height="379 src=">

Рис. 1. Сравнение результатов одномерного (А) и двумерного (Б) форезов мембранных белков эритроцитов человека. Результат: одномерный форез выявил около 30, а двумерный – 189 белков.

История

В 20 веке методы аналитической химии прогрессировали от простых процедур, имеющих дело с единичными элементами, к более сложным методам, основанным на физическом разделении и детекции веществ. Таким образом, уже более 50 лет назад большое внимание уделялось методам разделения частиц – хроматографии, электрофорезу, масс-спектрометрии. Несколько позднее изобрели капиллярный электрофорез (гг.). Из всех этих методов только масс-спектрометрия обеспечивала разрешение, достаточное для разделения и идентификации сложных элементных смесей, однако до недавнего времени, и она не могла адекватно разделять макромолекулы. Задавшись целью увеличить разделительную способность, ученые пришли к выводу о необходимости совместить в двух измерениях два каких-либо метода, основанных на измерении разных параметров. Изначально предлагалось использовать два различных растворителя при разделении молекул в процессе хроматографии на бумаге, а также предпринимались попытки совместить электрофорез, в качестве первого направления с хроматографией, в качестве другого. Эта же концепция также имела место при разделении молекул по седиментационным коэффициентам и по различиям в плотности при ультрацентрифугировании. Если два метода разделения независимы друг от друга, то финальное разрешение должно определяться суммой разрешения обоих методов. В принципе, можно было бы добавить более двух измерений, однако такой подход может привести к значительному падению концентрации исследуемого вещества и к возникновению проблем в детекции сигнала.

По крайней мере шесть независимых попыток разработать двумерный электрофоретический метод было предпринято, прежде чем в 1975-76 гг. была опубликована первая доступная весия метода, объединяющая изоэлектрофокусирование (ИЭФ) в растворах мочевины с электрофорезом в присутствии йонного детергента додецилсульфата Na (SDS). Разделение проводилось по первому направлению на основе заряда денатурированных белков (зависит от аминокислотной последовательности), а по второму направлению – в зависимости от молекулярной массы (см. раздел Методы).

В течение прошедших с тех пор 30 лет метод подвергался многим дополнениям, в частности, была предложена идентификация разделенных белков с помощью микросеквенирования и масс спектрометрии. Создаются компьютерные базы данных , содержащие сведения о клетках в культуре, белках плазмы крови, белках печени мыши и крысы, E. Coli, дрожжей и других модельных объектах. Практическое расширение области используемых pH связано с использованием коммерческих наборов иммобилинов, то есть иммобилизованных на специальных стрипах амфолинов. Использование таких наборов увеличивает воспроизводимость и увеличивает область действия метода. Иммобилиновая система позволяет использовать значительные нагрузки по белку: 1-10 мг на полоску (обычная нагрузка составляет около 100 мкг белка) и обеспечивает возможность изучения белков с рН > 8,5.

2Д электрофорез заложил основу для расшифровки молекулярного строения человеческих и животных тканей, клеток, бактерий и вирусов и для детектции изменений, происходящих при развитии, старении, заболеваниях а также в ответ на изменения окружающей среды. Протеомные методы используются для определения маркеров заболеваний и разработки новых лекарств. Также комбинация 2Д электрофореза с фракционированием клеточных органелл может дать информацию о внутриклеточной локализации специфических белков. Метод должен отличаться воспроизводимостью и возможностью количественной оценки результатов. В идеальном случае, должна быть возможность автоматизации всего набора процедур. До сих пор не существует полностью автоматизированного 2Д электрофореза, в связи с тем, что процедуры, входящие в него очень трудоемки.

Интересный аспект истории 2Д электрофореза показан на рис. 2, представляюшем число публикаций, найденных по запросу: 2Д электрофорез и протеомика. В последние 10 лет число статей, посвященных 2Д электрофорезу стабилизировалось и вышло на плато. С чем это связано - с тем, что 2Д электрофорез выходит из моды? Или это объясняется теми успехами секвенирования генома, которые наблюдаются в последние годы? Однако, даже если представить себе полностью расшифрованные геномы всех без исключения живых существ, протеомика будет иметь право на существование, так как связывает продукты деятельности генов с функциями организма. В последние несколько лет термин «протеомика» очень часто встречается среди цитируемых статей (рис. 2)

Рис. 2. Число публикаций, посвященных 2Д электрофорезу (2D or two D ) и протеомике (proteom *) в базе данных MEDLINE c 1975 по 2005 гг.

Протеомика в биологии

Эпигенетическая система отражает взаимодействие организма с окружающей средой, а также взаимодействия между генами и продуктами их деятеьности. Эти взаимодействия могут быть прямыми (рис. 3) или осуществляться посредством сложной сети взаимодействий на белковом уровне (рис. 4) В последнем случае, наличие дефекта в гене может приводить или не приводить к заболеванию; кроме этого, степень и тяжесть заболевания может изменяться в зависимости от индивидуума. В эти сложные взаимодействия также включается воздействия окружающей среды на организм.

https://pandia.ru/text/78/543/images/image006_30.jpg" width="377" height="337 src=">

Рис. 4. Схематическое изображение системы в которой между генотипом и фенотипом существуют комплексные взаимодействия на белковом уровне. Х –гипотетическое лекарственное средство; стрелки справа означают регуляторное воздействие лекарственного средства на фенотип (стрелка вверх – усиление экспрессии, стрелка вниз – подавление экспрессии специфические белки).

Известно, что только 2% болезней человека вызваны действием одного гена. Оставшиеся 98% заболеваний являются поли - или эпигенными по своей природе. Из этого утверждения следует то, что ни один ген не может действовать в одиночку. Он действует только в связи с другими генами а также с окружением. Гены могут экспрессироваться по-разному в разных организмах, а также ингибировать друг друга (явление, называемое эпистаз). Таким образом, для большинства полигенных заболеваний невозможно предсказать фенотип, исходя только из данных расшифровки генома.

Клетка реагирует на изменения внешней среды изменением ее белкового состава. В ответ на внешнее воздействие синтез одних белков увеличивается, других – уменьшается. Таким образом, фенотип не линейно зависит от проявлений генотипа, так как системы эпигенеза контролируют и модифицируют экспрессию генов. Практически все элементы эпигенетической системы – белки.

Молекулярный фенотип живой клетки невероятно лабилен. Многие белки имеют своей основной функцией перенос информации. Не существует фиксированного синтеза того или другого белка, поэтому концентрация белков в клетке изменяется. При обработке клетки гормонами, токсинами или лекарствами, количественные изменения наблюдаются не в одном, а в целом ряде белков. Существует два типа регуляции: up - и down-. Клетки – реактивные системы, в которых информация передается не только от генов к белкам, но и противоположном направлении (рис. 5).

https://pandia.ru/text/78/543/images/image009_22.jpg" width="378" height="378">

Рис.5. Схема взаимодействия генома с окружающей средой.

Элиминация единичного белка в организме (например, в Knock-out мыши) приводит к изменению всего молекулярного фенотипа целого организма. Более того, любое лекарство, которое воздействует на белок, например, на ионный канал, опосредованно влияет на белковый состав всего организма.

Степень гликозилирования определяет биофизические свойства и биологическую активность молекулы белка. Гликозилирование – это посттрансляционная модификация, поэтому оно является основой гетерогенности белковой популяции. Попытки охарактеризовать гетерогенную популяцию гликозилированных белков предпринимались с использованием капиллярного электрофореза в тандеме с масс-спектрометрией.

Протеомика в медицине

В клинической биохимии анализ индивидуальных белков человека используется для установления вида патологического процесса (дистрофии, опухолевый рост, воспаление) и определения пораженного органа (инфаркт миокарда);

Установления природы патологии, например, при диагностике энзимопатий, инфекционных (гепатит) и других заболеваний;

Оценки течения различных физиологических процессов (беременность , развитие иммунной системы) и обнаружения осложнений в их течении (патология беременности).

В области разработки лекарств основной проблемой, как правило, является увеличение или уменьшение активности белков, поэтому необходим некоторый метод, позволяющий регулировать специфическую активность. 2Д электрофорез является основным средством изучения воздействия лекарств на протеом, или на совокупность всех белков органа. Как правило новые лекарства тестируются с помощью 2Д электрофореза, на накопление их в критических органах, например, в печени.

Пример 1. Лекарство ловастатин, понижающее уровень холестерола в крови. Специфика его действия заключается в ингибировании HMG-кофермент А редуктазы. Однако, при анализе эффекта, которое оказывает это лекарство в комбинации с другими средствами, понижающими холестерол, было найдено, что количество белка HMG-Кофермент-A синтазы значительно повышается, в то время как количество других белков уменьшаются. Позднее обнаружили, что основное действие изучаемого лекарства заключается не в прямом ингибировании синтеза холестерола, а в повышении активности другого белка, липопротеинового рецептора, который удаляет из крови холестерин.

Пример 2. Превентивное лекарство против рака олтипраз повышает экспрессию ряда белков, включая афлатоксин В1 альдегидредуктазу, который разрушает один из натуральных канцерогенов. Предполагалось, что эффект имеет место в эндоплазматическом ретикулуме. При анализе 2Д геля, однако, выяснилось, что большинство изменений происходит в растворимой и митохондриальной фракциях клетки. Кроме этого, при сравнении экстрактов печени самок и самцов, экспрессия более трети белков отличалась в количестве. Следует заметить, что почти все эти различия регулируются на гормональном эпигенетическом уровне и не обусловлены наличием Х или У хромосомы.

Эти данные свидетельствуют о том, что экспрессия генов в тканях очень пластична, отвечает на воздействия большого числа факторов и почти всегда включает не один или два, а много генов. 2Д электрофорез идеально подходит для изучения подобных динамических изменений.

Как правило, результаты 2Д коррелируют с известными механизмами функционирования белков. Так, если лекарство усиливает пролиферацию в пероксисомах по данным электронной микроскопии, то и на 2Д электрофорезе будет наблюдаться увеличение количества белков, характерных для этого типа органелл. Подобные структурно-функциональные взаимодействия означают, что идентификация белков-мишеней для нового лекарственного средства может помочь открыть механизмы функционирования этих белков.

Еще одна важная функция 2Д методов в клинической протеомике это поиск новых белков-маркеров заболеваний, в частности, онко-маркеров. Отмеченные в таблице 1 потенциальные маркеры рака простаты представляют особый интерес по разным причинам. Например, тимозин бета-15 может определяться в моче и, по-видимому, имеет прямое отношение к молекулярным механизмам злокачественного перерождения клеток. Соответственно, ген тимозина бета-15 и его продукты могут стать не только диагностическими маркерами, но и в перспективе мишенями для различных воздействий с целью подавления опухолевого роста.

Таблица 1.

Название маркера	Значимость для диагностики рака простаты (РП)
1. Белок AGR2 (AGR2)	Секреторный белок, андроген-индуцируемый, обнаружен в РП, гиперэксперессия в 89% случаев РП. Обнаруживается при других опухолях
2. Простат-специфический мембранный антиген	Маркер с прогностической значимостью. Высокий уровень коррелирует со злокачественностью и метастазированием, но определяется и при аденоме
3. Тимозин бета 15	По иммуногистохимии – маркер с прогностической значимостью «Мочевой» маркер, что перспективно при организации скрининга Обнаруживается при других злокачественных опухолях.
4. Белок Р63
5. Рацемаза (alpha-methylacyl CoA racemase, AMACR)	По иммуногистохимии – маркер с прогностической значимостью.
6. Антиген простатных стволовых клеток (Prostate stem cell antigen, PSCA)	Маркер клеточных поверхностей, показана гиперэкспрессия гена при РП до 80%; высок уровень экспрессии при метастазах РП
7. Высокомолекулярный цитокератин 34betaE12 (High-molecular-weight keratin 34betaE12)	По иммуногистохимии – маркер с прогностической значимостью.

Методы

Комплексное изучение «протеома» проводится методами и технологиями, направленными на одновременное разделение, а также последующую идентификацию и анализ всех белков, синтезирующихся в клетке или другом объекте (органе, организме).

1. Изоэлектрофокусированием (ИЭФ) называют разработанный в начале 60-х годов метод разделения белков под действием электрического поля в среде с градиентом pH, который создается специальными амфотерными веществами – «амфолитами», способными переносить ток (хорошая проводимость), а также создавать локально и поддерживать рН (хорошая буферная емкость). Появление наборов полиамино-поликарбоновых кислот (амфолинов) обеспечило высокую эффективность фракционирования белков с помощью ИЭФ, при этом разделение осуществлялось за счет различий в pI.

2. Среди множества электрофоретических методов разделения белков наибольшая эффективность оказалась у особой модификации метода Лэммли для вертикальных пластин с градиентом концентрации полиакриламидного геля, использующего ионный детергент – додецилсульфат Na (SDS). За счет гидрофобных взаимодействий, используемый детергент практически одинаково связывается с подавляющим большинством белков в соотношении 1.4 мг SDS на 1 мг белка. Огромный избыток полностью диссоциированных остатков сульфокислоты делает несущественной роль заряда самого белка. Электрофоретическая подвижность комплекса белок-SDS в градиентном геле оказывается линейно связана с десятичным логарифмом его молекулярной массы (Mm). Таким образом, эта система обеспечивает разделение белков по различиям в Mm.

3. Идентификация миросеквенированием основана на определении (расшифровке) части аминокислотной последовательности белка. Разработанные методы микросеквенирования позволяют работать с очень малыми количествами пептидов - вплоть до нанограммовых. Это важно, так как определение даже короткого фрагмента аминокислотной последовательности часто оказывается решающим для идентификации целого белка. В настоящее время возможно как проведение прямого N-концевого секвенирования белка, перенесенного на инертную мемебрану, так и секвенирование отдельных пепетидов, полученных из изучаемого белка после его ферментативного расщепления высокоэффективной жидкостной хроматографией. Микросеквенирование позволяет выявлять одиночные аминокислотные замены в анализируеемых белках.

4. Масс-спектрометрия устанавливает какие атомы входят в состав молекулы, какова структура их расположения и изотопный состав, а также какова масса молекулы. Существенное отличие масс-спектрометрии от других аналитических физико-химических методов состоит в том, что оптические, рентгеновские и другие методы детектируют излучение или поглощение энергии молекулами или атомами, а масс-спектрометрия имеет дело с самими частицами вещества. Масс-спектрометрия измеряет соотношение массы частицы к заряду. Для этого используются законы движения заряженных частиц материи в магнитном или электрическом поле. Различают несколько модификаций масс-спектрометрических методов:

· Мягкая матриксная ионизация (M atrix-A ssisted L aser D esorption/I onization - MALDI) позволяет анализировать такие биополимеры, как полисахара, пептиды и макромолекулы, без риска повредить их структуру. Ионизация производится лазерным пучком, а матрикс используется для защиты молекул от разрушающего действия лазера. Матрикс состоит обычно из кристаллов кислот в смеси с органическим растворителем.

· Тандемная масс-спектрометрия (MS/MS) проводится на приборе, который объединяет несколько анализаторов, позволяющих последовательно изолировать один пептид, стабилизировать ионы, составляющие его и идентифицировать фрагменты. Используется в идентификации белковых пятен после 2Д электрофореза.

5. Капиллярный электрофорез - это метод анализа сложных смесей, использующий электрокинетические явления – электромиграцию ионов и других заряженных частиц и электроосмос – для разделения и определения компонентов. Эти явления возникают в растворах при помещении их в электрическое поле, преимущественно, высокого напряжения. Если раствор находится в тонком капилляре, например, в кварцевом, то электрическое поле, наложенное вдоль капилляра, вызывает в нем движение заряженных частиц и пассивный поток жидкости, в результате чего проба разделяется на индивидуальные компоненты. Модификацией метода является капиллярный электрофорез в чипах. Идентификация белков с помощью масс-спектрометрии может проводиться непосредственно после разделения.

6. Недавно был аннонсирован метод капиллярного изоэлектрофокусирования. После изофокусирования в канале чипа, покрытого специальной пленкой, чип замораживался, пленка удалялась и содержимое канала подвергалось высушиванию при критической точке для предотвращения изменения позиции белковых пятен. После этого матрикс для MALDI добавлялся непосредственно к содержимому чипа. В результате одновременно удавалось считывать информацию о молекулярном весе и изоэлектрической точке данного пептида.

7. Двумерный электрофорез:

При исследовании белков методом 2Д электрофореза, целью исследования является:

· обеспечить воспроизводимое разделение основных известных белков, характерных для данной ткани;

· показать присутствие известных минорных белков;

· выявить и идентифицировать маркерные белки, характеризующих известные изменения в данной ткани.

Для достижения цели решают следующие задачи:

1) Все белки, содержащиеся в изучаемом образце, подвергаются солюбилизации и становятся объектами анализа;

2) Проводится аналитическое фракционирование по двум независимым друг от друга физико-химическим свойствам полипептидных цепей, отражающих особенности их первичной структуры - комбинированное использование – двумерный гель-электрофорез (2D):

· Изоэлектрическое фокусирование (ИЭФ), обеспечивает фракционирование по pI.

· Электрофорез в присутствии SDS (SDS-ЭФ) обеспечивает разделение по Mm.

3) Выявление белковых фракций после разделения с помощью высокочувствительных методов детекции белков (различные модификации масс-спектрометрии).

4) Стандартизированное описание белков на двумерных электрофореграммах в системе прямоугольных координат, в которых одна из координат являться функцией молекулярной массы, а другая – изоэлектрической точкой для каждого вида полипептидных цепей.

· Солюбилизация,

· подбор оптимальных условий

· Повышение разрешения – использование иммобилиновых стрипов

3. II направление (SDS PAGE)

· Повышение разрешения – увеличение размера геля

· Чувствительность,

· избирательность детекции/окраски

· Компьютерный анализ изображений

6. Вырезание отдельных белковых пятен

· Точность попадания

7. Идентификация белков

· Масс-спектрометрия

· Интерпретация данных

· Сравнение с другими базами данных

Создание протеома изучаемого объекта

Заключение

Современная протеомика имеет почти 30-ти летнюю историю, началом которой стали разработки метода двумерного электрофореза белков и создание системного подхода в исследованиях белковых продуктов генной экспрессии. Протеомика располагает внушительным методическим арсеналом и большими ресурсами по биоинформатике. Это позволяет надеяться, что прогресс в протеомных исследованиях человека (в сочетании с прогрессом в других областях функциональной геномики) качественно усилит потенциал современной клинической биохимии.

Протеомика является важнейшим источником новых знаний о белках человека, которые необходимы для клинической биохимии, поскольку на основе этих знаний формируются и детализируются представления о молекулярных основах различных болезней, а также расширяются диагностические возможности современной медицины.

Литература:

6. Остерман исследования белков и нуклеиновых кислот. Москва, Наука, 2002.

7. Карягина. Клинико-диагностическая интерпретация электро-фореграмм белков сыворотки крови. Учебно-методическое пособие. - СПб. Изд-во СПбГУ, 2000.

8. N. G.Anderson, N. L.Anderson. Twenty years of two-dimensional electrophoresis: Past, present and future. Electrophoresis, (1996) 17, pp. 443-453.

9. Rob Haselberg ∗, Gerhardus J. de Jong, Govert W. Somsen. Capillary electrophoresis–mass spectrometry for the analysis of intact proteins. Journal of Chromatography, (20pp 81–109

10. Jurgen Cox and Matthias Mann. Is Proteomics the New Genomics? Cell 130, (2007) pp 395-398.

11. Wikipedia: http://en. wikipedia. org/

Отечественному биологу, особенно, молекулярному, все реже и реже приходится писать на родном языке. Понятно, что бóльшая часть научных статей в нашей области создается на нынешнем языке научного общения - английском. Поэтому вместо вступления хочу поблагодарить главного редактора «Биомолекулы» - это он каким-то образом смог заставить меня написать этот текст, пробудив не то графоманский зуд, не то воспаленное эго, не то просто любовь к русскому языку. Но писать мне было легко: волею судеб я уже более пятнадцати лет занимаюсь одним и тем же - идентификацией и количественным анализом белков. То есть тем, что сегодня называется протеомикой . Практически всё, что я об этом знаю, по возможности доступно изложено в следующих строках.

Генеральный партнер цикла - компания : крупнейший поставщик оборудования, реагентов и расходных материалов для биологических исследований и производств.

Одна из главных миссий «Биомолекулы» - докопаться до самых корней. Мы не просто рассказываем, какие новые факты обнаружили исследователи - мы говорим о том, как они их обнаружили, стараемся объяснить принципы биологических методик. Как вытащить ген из одного организма и вставить в другой? Как проследить в огромной клетке за судьбой нескольких крошечных молекул? Как возбудить одну крохотную группу нейронов в огромном мозге?

И вот мы решили рассказать о лабораторных методах более системно, собрать воедино в одной рубрике самые главные, самые современные биологические методики. Чтоб было интереснее и нагляднее, мы густо проиллюстрировали статьи и даже кое-где добавили анимации. Мы хотим, чтобы статьи новой рубрики были интересны и понятны даже случайному прохожему. И с другой стороны - чтобы они были так подробны, что даже профессионал мог бы обнаружить в них что-то новое. Мы собрали методики в 12 больших групп и собираемся сделать на их основе биометодический календарь. Ждите обновлений!

Я был доволен, дней мне не хватало, и жизнь моя была полна смысла.
Братья Стругацкие. Понедельник начинается в субботу
- Десять лет, - со смехом проговорил он, жуя. - Вот через столько он что-нибудь напишет.
Джеймс Джойс. Улисс (пер. с англ. В. Хинкиса и С. Хоружего)

Часть 1. До генома. Идентифицировать можно только то, природу чего ты понимаешь

Физики шутят: «В вашем деле все пойдет на лад, когда биология станет химией, а химия - физикой ». История протеомики до ее современного состояния немного напоминает эту шутку. Физики создали могучую технику, а когда науки о жизни стали модной тенденцией, попробовали использовать ее для анализа белков. Вначале разработка физических инструментов стимулировала их использование в биологии и медицине, а результаты - демонстрационные - только намекали на какие-то реальные достижения. Сейчас тот самый момент, когда в этой области просматривается серьезный результат, в том числе для медицины. Я попробую здесь рассказать о развитии высокопроизводительного анализа белков - протеомики, - которое наблюдаю давно, и наблюдаю глазами биолога. Может быть, физики опять пошутят, а вот коллегам-биологам и врачам будет немного легче понять суть происходящего.

Рисунок 1. Главные протеомные вехи. 1950 г. - Группа шведа Пера Эдмана предложила химический метод секвенирования пептидов. 1951–1955 гг. - Под началом британца Фредерика Сэнгера определили структуру короткого белка инсулина и доказали, что отдельные белки не аморфны в плане состава, а обладают постоянной последовательностью аминокислотных остатков. 1959 г. - Американцы Розалин Ялоу и Соломон Берсон создали первый иммуноанализ, в том числе для определения белков. 1967 г. - Создали первый автоматический белковый секвенатор, работающий по методу Эдмана. 1970 г. - Швейцарец Ульрихом Лэммли предложил оптимальный метод гель-электрофореза белков в денатурирующих условиях - с использованием додецилсульфата натрия. 1975 г. - Американец Патрик О’Фарелл и немец Йоахим Клозе независимо изобрели 2D-электрофорез белков и получили первые протеомные карты. 1984 г. - Под руководством американца Джона Фенна разработали ионизацию молекул электрораспылением. Впоследствии она позволила осуществлять масс-спектрометрию макромолекул, включая белки, без их разрушения. 1985 г. - Коичи Танака из Японии предложил мягкую ионизацию макромолекул лазером для масс-спектрометрии. Немцы Франц Гилленкамп и Михаэль Карас применили сходный метод для белков и пептидов. Возник метод ионизации MALDI. 1993-1996 гг. - Несколько групп исследователей предложили идентифицировать белки при помощи масс-спектрометрии фрагментов протеолиза и поиска по предсказанной из генома последовательности. Возникла масс-спектрометрическая пептидная карта (пептидный фингерпринт, или дактилоскопия). 1994 г. - Термин «протеом» как белковое дополнение к геному ввел австралийский аспирант Марк Уилкинс. 1994–1999 гг. - Появились первые поисковые программы для идентификации белков масс-спектрометрией по геномным последовальностям. Протеомика стала доступна широкому кругу пользователей. 1999–2001 гг. - Скорострельная (shotgun ) протеомика. Несколько научных групп предложили применять для идентификации смеси пептидов совмещение высокоэффективной жидкостной хроматографии и тандемной масс-спектрометрии. Использовали ионизацию электрораспылением. 2000–2005 гг. - Российский физик Александр Макаров, работающий за рубежом, изобрел ионную ловушку нового типа - Orbitrap . Приборы на основе Orbitrap ввели в эксплуатацию. Масс-спектрометрия высокого разрешения демократизировалась и начала широко использоваться в протеомике. 2005 г. - Американцы Кристи Хантер и Ли Андерсон продемонстрировали использование масс-спектрометрического метода мониторинга множественных реакций (MRM ) для количественного анализа природных пептидов. Возникла направленная (таргетная) протеомика. 2007 г. - Под руководством американца Стивена Гиги предложили новый метод оценки уровня ложноположительных результатов скорострельной протеомики с использованием «фальшивых» последовательностей (анализ ). 2012–2014 гг. - Скорострельная протеомика достигла уровня идентификации около 10 тысяч белков человека в одном образце - примерно половины кодируемых в геноме. Под руководством немца Бернхарда Кустера и американца Ахилеша Пандея независимо были опубликованы работы, декларирующие черновые версии полного протеома человека.

Переместимся в то время, когда матричные процессы передачи информации в клетке уже были вчерне изучены (рис. 1). Было понятно, как in vivo синтезируются белки, из каких аминокислот они состоят. В то же время, в начале 1980-х годов, уже развилась молекулярная иммунология, возникла техника получения моноклональных антител . Начали развиваться методы получения рекомбинантных белков, подпитываемые изобретением полимеразной цепной реакции . Достигли совершенства методы разделения биомолекул - разные виды хроматографии и электрофореза .

Ферментативная активность - первые знания о белках

Чтобы поставить задачу «идентификации» белка в биологическом образце, уже было необходимо осознавать существование криковской «догмы» молекулярной биологии , в которой код нуклеиновой кислоты с информационными потерями конвертируется в аминокислотную последовательность. Идентификация некоторого соединения - это установление его структуры, в случае полипептида - полное или частичное определение его последовательности, иными словами, секвенирование . Следующей стадией будет не только идентификация (то есть, качественный анализ белка), но и определение его концентрации - количественный анализ. Интересно, что понятие об определении активности белка развилось еще до того, как установили его химическую природу. Примерно говоря, ферментативная активность свежего мясного фарша (то есть, гомогенизированной мышцы млекопитающего) могла быть установлена простыми спектрофотометрическими методами еще в начале XX века (рис. 2), когда химическая основа жизни оставалась неизвестной. Однако белковый катализатор, осуществляющий эту реакцию, можно было оценить количественно в условных единицах активности. И до сих пор в клинике многие биомаркеры определяют в таких условных единицах - например, аланиниаминотрансферазу и аспартатаминотрансферазу , несмотря на то, что современная техника способна определить их абсолютное количество. В случае многих ферментов определение активности и удобно, и правильно, поскольку часть молекул может не работать вследствие инактивации, при этом присутствуя в образцах.

Это внутриклеточные ферменты, организующие в клеточных митохондриях связь метаболизма углеводов и аминокислот. Их появление в крови свидетельствует о разрушении клеток печени.

Антитело как идентификатор от противного

Кроме оценки активности, с 1970-х годов у исследователей появилась еще одна возможность количественно измерять белки, не зная их структуры. Речь идет об использовании антител, особенно моноклональных , получение которых изобрели в 1975 г.; подробнее об этом рассказывает статья «12 методов в картинках: иммунологические технологии » . Антитела можно вырабатывать к очищенным компонентам, а можно и к целым тканям, клеткам или фракциям. Причем если они моноклональные, то система их получения и их аналитические характеристики сохраняются без изменений от одной партии к другой. Если мы знаем, против чего были антитела, то есть использовали очищенный и идентифицированный другим, «ортогональным» методом антиген, то полученное связывающее вещество - антитело - может широко использоваться для его повторной идентификации в сложных смесях. Интереснее с антителами, полученными к неизвестным антигенам. Не имея понятия о структуре антигена, такие антитела стали использовать для диагностики злокачественных опухолей. Некоторые из них связывали намного больше своего антигена у больных людей, чем у здоровых. Методику оценки стандартизовали и стали использовать такие моноклональные антитела для диагностики, точно не зная химической структуры антигена. Ярким примером такого подхода служит гликопротеин CA-125, открытый Робертом Бастом с соавторами в виде антитела к нему в далеком 1981 году . Лишь значительно позже идентифицировали ген этого продукта и сам белок - муцин 16 .

Выделение чистых белков и секвенирование по Эдману

Тем не менее к 1970-м годам биохимиков перестала удовлетворять работа вслепую, например, измерение активности ферментов и других соединений без представлений об их химической структуре. Появились способы очистки белков, которые сочетали принципы хроматографии, электрофореза, центрифугирования, некоторые из которых исчезли из обращения, а другие используют до сих пор . Отдельной задачей было подтвердить чистоту соединений во фракциях после очистки. Для этого использовали спектральные методы (от простых до сложных), а также визуализацию окрашенных полос при электрофорезе. Получение из биоматериала выделенного хотя бы до 90% чистоты белка без использования антител и других специфических связующих веществ и тогда, и сейчас - длительный трудоемкий процесс. 1970–1980-е годы - золотой век развития методов разделения белков, когда заливали огромные гели для электрофореза, конструировали метровые колонки для ручной и автоматической хроматографии.

Если вам повезло, то после нескольких месяцев или лет кропотливой работы вы убедились, что в пробирке или в геле находится ваш «товар» - белок, функцию которого вы изучаете. Какие варианты его идентификации у вас есть, если вы пока в веке двадцатом? Во-первых, если у вас есть гипотеза по поводу того, что в вашей пробирке, вы можете использовать известные антитела, если они есть в продаже или любезно предоставлены владельцами. Конечно, если сегодня доступны антитела разных видов к большинству белков человека и модельных животных, в то время их ассортимент был гораздо более скромным. Поэтому шанс на окраску интересующей вас молекулы антителами очень мал. Но не отчаивайтесь! Еще в 1950-е годы шведский химик Пер Эдман разработал метод секвенирования пептидов (рис. 3).

Рисунок 3. Секвенирование белков по Эдману. Если обработать пептид изотиоцианатом фенила (ФИТЦ ), электрофильный атом углерода на изотиоцианатном радикале при умеренном подщелачивании взаимодействует с нуклеофильным азотом незаряженной аминогруппы. В итоге на N-конце пептида образуется фенилтиокарбомоильный радикал. Если умеренно закислить реакционную смесь, он отщепляется, увлекая с собой N-концевую аминокислоту, с образованием тиазолинона со специфичным радикалом, характеризующим эту аминокислоту. При этом остальная часть аминокислотной цепи остается неизмененной. Особое производное, которое будет отличаться по присущему аминокислоте радикалу, еще раз преобразуют в кислых условиях - для стабилизации - и анализируют хроматографически. Так можно отличить такие производные для всех аминокислот, поскольку из-за характерного радикала они будут характеризоваться своим временем выхода с обращенной фазы . Если белок или пептид, который мы анализируем, присоединен к твердофазному носителю, производное N-концевой аминокислоты можно смыть и анализировать отдельно, а цикл анализа повторить, выстраивая таким образом аминокислотную последовательность.

Метод Эдмана был по тем временам очень прогрессивен. Он с высокой точностью предоставлял последовательность до 30 аминокислотных остатков. Характеризовался достаточно высокой чувствительностью, будучи способным секвенировать пептиды в количестве менее 0,1 нмоль с 99% точностью. Более того, в конце 1960-х его автоматизировали в виде пептидного секвенатора, где робот-раскапыватель поочередно снимал N-концевые производные с полипептидов, закрепленных на специальной бумаге, направляя их затем в хроматограф. Но исследователям опять хотелось большего - их не устраивала необходимость в очистке пептидов и белков перед секвенированием, а также некоторые другие ограничения эдмановского метода, в частности, его неспособность секвенировать продукты с модифицированным N-концом.

Небольшой интерес к методу Эдмана существует до сих пор, в особенности, для белков и пептидов тех организмов, последовательность которых нельзя предсказать из данных секвенирования нуклеиновых кислот . В этом методе реализуется прямой анализ, где ошибки связаны с технической погрешностью. Последовавшие за ним способы анализа аминокислотной последовательности содержат элементы предсказания, поэтому к техническим ошибкам в них прибавляются алгоритмические (см. ниже).

Двумерный электрофорез - первая карта протеома

Как я уже упоминал выше, при подготовке к качественному и количественному анализу белков использовали обычные методы разделения молекул , в том числе электрофорез. В 1970 году в электрофорезе белков произошла методическая революция - швейцарец Ульрих Лэммли предложил оптимальный метод гель-электрофореза в денатурирующих условиях. Белки жестко денатурировали амфифильным веществом, вроде мыла - додецилсульфатом натрия , - за счет чего каждая молекула покрывалась слоем из этого детергента. Суммарный отрицательный заряд такого комплекса оказывался примерно пропорционален молекулярной массе белка. Это позволяло делить белки в полиакриламидном геле хотя и с помощью электрического поля, но по молекулярной массе. По справедливости отметим, что Лэммли не изобрел метод de novo , а лишь оптимизировал его по существующим в литературе предпосылкам. За это, кстати, его работа сейчас входит в пятерку самых цитируемых в мире научных статей . Разработки в этой области публиковали и ранее, в том числе в 1967 г. американец Арнольд Шапиро с соавторами .

Хорошо принятый метод Лэммли стал совершенствоваться и комбинироваться с другими видами разделения белков. В 1975 году американец Патрик О’Фарелл и немец Йоахим Клозе независимо предложили комбинировать денатурирующий электрофорез в геле с предварительной электрофокусировкой белков. Фокусировку проводят в относительно тонкой, толщиной с гель (1–2 мм) стеклянной трубке . Трубку заполняют гелем со специальными полимерами - амфолинами , - которые способны создавать в ней неподвижный градиент рН. Таким образом, при движении в электрическом поле нанесенные в эту трубку белки останавливаются в участке, где амфолинами был достигнут рН, равный изоэлектрической точке молекулы белка. Гель в виде тонкого тяжа выдавливают из трубки и приплавляют к готовой гелевой пластине для обычного денатурирующего фореза по Лэммли, после чего проводят разделение в другом направлении. Белки, вначале распределенные по изоэлектрической точке, теперь движутся в зависимости от их молекулярной массы. Полученный метод справедливо называется двумерным (2D ) электрофорезом (рис. 4). Как можно предполагать, каждый белок на итоговой пластине геля после окраски выглядит не как полоса (в отличие от обычного денатурирующего геля), а как сфокусированное, округлое пятно. Таким образом, О’Фарелл и Клозе впервые показали белковую карту, где каждое пятно на большой пластине геля (до 40×40 см) представляет одну изоформу белка, а его размер и интенсивность - более или менее пропорциональны его концентрации.

Искусные руки биохимиков прошлого многократно усовершенствовали метод двумерного электрофореза, который был ведущим в анализе белков до середины 2000-х годов. Вместо заливки трубок амфолины размещали на готовых полосках. Были предложены разные устройства для приготовления гелевых пластин, разных модификаций процесса электрофореза, причем для разных размеров и толщины геля в зависимости от задачи исследования. По чувствительности совершенствовали красители, в том числе, флуоресцентные. Более того, на волне популярности двумерных гелей, некоторые процессы их приготовления и окраски автоматизировали. Поскольку характеристики окрашенных пятен косвенно связаны с количеством белка в пробе, привлекательно сравнивать изображения гелей, полученные из одних и тех же образцов в различных условиях. Процесс обработки изображений гелей также автоматизировали, причем появилось много конкурирующих компьютерных программ, осуществляющих обработку и сравнение сканов двумерных гелей.

В зависимости от интервала концентраций находящихся в биоматериале белков, число отдельных пятен на двумерных гелях достигало 5 тысяч. С сегодняшней точки зрения очевидно, что это не означает, что на геле визуализированы продукты 5 тысяч генов. Изоформы одного генного продукта, которые отличаются по последовательности за счет гетерозиготности или протеолиза или по более тонкой структуре за счет модификаций остатков, будут, как правило, отражаться в виде отдельных пятен. Например, отщепление одного остатка аргинина от небольшого белка альфа-амилоида так существенно меняло изоэлектрическую точку, что на геле пятно перемещалось примерно на 10 см .

Тем не менее двумерная электрофореграмма с визуализированными тысячами белков может считаться первым протеомом - то есть, первым видом анализа, в котором определяется всё множество белков, присутствующих в биологическом образце, или существенная их доля. Отмечу, что этот метод был развит существенно задолго до появления термина «протеом», но об этом чуть позже.

Предположим, мы проанализировали путем двумерного электрофореза образцы опыта и контроля, например, клеточные линии после обработки лекарственным веществом и без такой обработки. Получили похожие карты-электрофореграммы, но десять пятен после обработки появились, пять исчезли полностью, и еще какое-то количество изменило свою интенсивность. Что нам можно сделать, если мы находимся в 1990 году? Всё, о чем мы говорили ранее. Применить метод Эдмана. Покрасить электрофореграмму антителами, которые есть в наличии, то есть осуществить вестерн-блоттинг . Для обоих вариантов белки с геля с использованием электрического поля переносят на бумажную или подобную ей мембрану, с которой уже осуществляют дальнейшие манипуляции. Ограничения использования антител понятны - они, хоть и чувствительны, видят только свои мишени. Ограничение эдмановского метода здесь - чувствительность. Он хорошо работает от десятков и сотен пмоль белка, а современные красители «видят» пятна, в которых содержатся 2,5–5 пмоль. Учитывая потери при переносе на мембрану и вероятную потребность в расщеплении белков на пептиды, осознаем, что метод Эдмана сможет справиться с меньшей частью из визуализированных на хорошем геле белковых пятен.

«Звездное небо» двумерного электрофореза - первый и последний способ увидеть протеом воочию. Более того, при качественной постановке методики человеческого глаза вполне хватает, чтобы обнаружить отличия между похожими пластинами с гелем. Последующие методы протеомики, рассказ о которых впереди, образуют «большие данные», невидимые, как божество. Это обстоятельство во многом сохраняет популярность «двумерника», который используют по сей день, хотя и не так часто, как раньше. Тем не менее в продаже до сих пор имеется оборудование и программное обеспечение для полного цикла выполнения этой методики.

По личным впечатлениям, двумерный электрофорез белков - одна из самых трудоемких и сложных для выполнения биохимических процедур, в которой используются десятки стадий, реагентов и несколько типов лабораторного оборудования. В лаборатории мы в шутку называли тех, кто ставит двумерный электрофорез, «протеомными художниками». И действительно, постановка метода длится два-три дня и требует существенной концентрации на всех ее этапах. Малейшая оплошность приводит к существенному искажению «картины» на геле. Метод не автоматизируется целиком, что и было одной из причин снижения его популярности. Однако он получил второе дыхание уже на рубеже веков, когда в науку ворвался полный геном, а в протеомику вслед за ним - масс-спектрометрия .

«Диаэм»: современное оборудование для протеомного анализа

Материал предоставлен партнёром - компанией «Диаэм»

Часть 2. Постгеном

Протеомика как постгеномная технология

Появление последовательностей геномов множества организмов, начиная с бактерий и завершая большими геномами растений и животных (в том числе человека ), уменьшило пространство поиска при идентификации белков. За исключением ситуации с секвенированием общей ДНК сложной смеси организмов (так называемого метагенома почвы, содержимого кишечника, океанских вод и т.д.), биохимики обычно представляют, какой организм они анализируют. И это значит, что белки в исследуемом образце синтезированы при помощи потока информации с кодирующих их генов этого организма. Собственно, так и появился термин «протеом » - в 1994 году Марк Уилкинс , австралийский аспирант, предложил его для обозначения белкового, или протеинового дополнения к геному . Геном - прочитанный геном - породил остальные «-омы» , а технологии, позволяющие их анализировать, в конце 1990-х годов почти гипотетические, составили группу постгеномных , или, как их теперь часто называют, омикс-технологий .

Real talk, think about it , господа аспиранты.

Строго говоря, истинные омиксы - это анализ продуктов передачи геномной информации, то есть кодирующих и некодирующих РНК и белков. Остальные омиксы, по сути, косвенные. Они не связаны с генетическим кодом прямым потоком информации и объединяются в группы по химической природе анализируемых соединений. Примечательно, что омикс-технологии производят одновременный анализ тысяч соединений, например, метаболитов, липидов, гликанов и т.д., и называются, соответственно, метаболомикой, липидомикой (частично они перекрываются), гликомикой и т.д. Энтузиасты последнего десятилетия - эпохи слоганов и мемов - придумали невероятное количество «омик», в том числе достаточно комичные. Число разных употреблений суффикса «омика» или «омикс» к 2010 году превзошло две сотни, что позволило пошутить на эту тему даже «гражданскому» Wall Street Journal , обозвавшему процесс «инкризингомикой» .

Явление масс-спектрометрии белковому народу

Точное измерение молекулярной массы химического соединения - желанная цель аналитической технологии. Действительно, это знание решает многие проблемы, а иногда, при наличии дополнительной информации, обеспечивает идентификацию искомого вещества. Масс-спектрометрия - набор методов, направленных на измерение молекулярной массы соединений. Этот подход развивался еще с конца 19 века, когда сэру Джозефу Джону Томсону удалось создать масс-спектрограф, состоящий из газоразрядной трубки, разделяющей по траекториям движения заряженные частицы с разной молекулярной массой. Затем Артур Дэмпстер разработал... Но стоп! В этой статье невозможно охватить всю историю масс-спектрометрии, да в этом и нет необходимости, поскольку это много раз делалось профессионалами . Мне, биохимику по специальности, уместно будет предложить обзор этой увлекательной области в биологическом контексте, чтобы навести мосты между сложной физической техникой и ее биомедицинским применением.

Нам, биологам, придется поверить, что нет никакого другого способа измерить молекулярную массу, кроме как заставить молекулы двигаться. И сразу же после этого поверим в то, что заставить молекулы двигаться можно только в заряженном виде, то есть обратив их в ионы. Так что первый этап масс-спектрометрического анализа (рис. 5) - это ионизация. Первые методы ионизации были жесткими, так что макромолекулы в них не сохранялись. Успехи масс-спектрометрии в биологии, как будет ясно из дальнейшего, связаны с возможностью ионизировать биомолекулы, не разрушая их. После ионизации анализируемые соединения под воздействием электрического поля надо переместить в детектор, который поставит особенности движения молекул в электромагнитном поле в соответствие их молекулярной массе, а точнее, отношению молекулярной массы и заряда. Проще говоря, если две разные молекулы несут одинаковый заряд, но отличаются по массе, приложение к ним одинакового электрического поля заставит их летать по-разному. Если обучить, то есть откалибровать детектор с использованием стандартов с заведомо известными массами, можно, оценивая движение неизвестных ионов, определять их отношение массы к заряду. Если заряд равен единице (то есть мы имеем дело с однозарядными ионами), отношение численно равно молекулярной массе.

Масс-спектрометрия сегодня - гигантская область, активно используемая почти во всех областях промышленности, в химии, биологии, медицине, охране окружающей среды. Более того, в Манхэттенском проекте и, вероятно, в советских ядерных проектах при помощи масс-спектрометра обогащали радиоактивный уран, разделяя его на изотопы. На самом крупном форуме по масс-спектрометрии - конференции Американского масс-спектрометрического общества - ежегодно собирается до 15 тысяч участников. Доля биомедицинских методов в масс-спектрометрии продолжает расти вместе с вложениями в биотехнологии в целом.

Проклятие изотопного распределения

Создание масс-спектрометров совпало по времени с обнаружением у химических элементов разных изотопов . Решая химические задачи в школе или проводя различные биологические эксперименты, мы зачастую не задумываемся, что важные элементы, составляющие органические вещества (C, O, N, S), содержат значимую долю стабильных изотопов, отличающихся по массе от номинальных, указанных в таблице Менделеева. Биологи сталкиваются с радиоактивными изотопами, которые еще недавно использовались для мечения биомолекул. Проблему стабильных и радиоактивных изотопов хорошо знают археологи и палеонтологи - с помощью них они датируют свои находки . Но в большинстве молекулярно-биологических экспериментов помнить об этих примесях нет нужды.

Отношение стабильных изотопов для каждого элемента - это некоторое свойство материалов. Интересно, что такие отношения стабильных изотопов различны в разных средах, например, в пресной и морской воде, в горных породах, а также в разные периоды существования Земли и других небесных тел. Поэтому измерение этого параметра в разных условиях вызывает серьезный интерес в разных областях естественных наук . Но для изучения точных масс белков и пептидов в протеомике существование стабильных изотопов - это своего рода проклятие.

Для упрощения предположим, что в составе измеряемого нами соединения имеется примесь только стабильного изотопа углерода - 13 С. Его доля в массе общего углерода на планете равна примерно 1%. Таким образом, если в нашей молекуле 10 углеродных атомов, а ее номинальная, по таблице Менделеева, молекулярная масса, скажем, равна 152 атомных единицы массы, лишь каждая десятая молекула будет содержать «тяжелый» атом С. И наша молекула будет иметь молекулярную массу не 152, а около 153 Да. Таким образом, масс-спектрометр от одного соединения зарегистрирует не один пик, а несколько. Первый будет содержать номинальную массу, деленную на заряд (m/z) - при единичном заряде - 152, второй - в 10 раз ниже по интенсивности, которая просто отражает относительное число молекул такой массы, с m/z = 153 Да . Поскольку по статистике будут существовать молекулы с двумя и более «тяжелыми» атомами, их пики также могут находиться в спектре, но из-за малой интенсивности могут не преодолеть чувствительности детектора.

Современные масс-спектрометры способны разрешить пики с разностью молекулярных масс намного меньше 1 Да.

Теперь представим похожее соединение, но оно уже будет включать 100 углеродных атомов. Пусть его номинальная молекулярная масса будет равна 1502 Да. Легко понять, что число молекул, содержащих хотя бы один «тяжелый» атом, в этом случае будет превышать таковое с номинальной молекулярной массой. Из нескольких пиков, которые будут соответствовать разному числу атомов изотопа 13 С, самым высоким в этом случае будет уже второй пик, с m/z примерно равным 1503 Да. А что будет, если мы будем снимать масс-спектр соединения размером с небольшой белок, с массой свыше 10 000 Да? Значительное число одинаковых в химическом плане , но разных по изотопному составу молекул образуют целый лес пиков в масс-спектре, причем самый интенсивный из них будет находиться далеко в середине этого набора пиков, а по молекулярной массе он будет значительно отличаться от номинальной, так называемой моноизотопной молекулярной массы соединения (рис. 6). Например, моноизотопная масса сывороточного альбумина крупного рогатого скота, столь любимого биохимиками белкового стандарта, равна 66 389,86 Да, тогда как «средняя» (average) масса, соответствующая самому интенсивному пику на масс-спектре, составляет примерно на 43 Да больше!

Накапливаются сведения о разном поведении стабильных изотопов одного и того же элемента в химических и биологических процессах . Однако в большинстве случаев работает допущение, что свойства соединений одного строения с разным изотопным составом одинаковы.

Рисунок 6. Схемы изотопного распределения молекул от низкомолекулярных метаболитов до белка. Чем тяжелее ион, тем ниже интенсивность самого высокого пика. Красной отметкой показана моноизотопная масса - она рассчитывается, как будто в веществе присутствует только основной изотоп.

Число ионов каждого вещества, перенесенного в детектор масс-спектрометра, очевидно, составляет сумму интенсивностей всех изотопных пиков, относящихся к соединению. Также это количество можно выразить в виде площади под касательной, проходящей по вершинам этих пиков. Представим, что в детектор поступили несколько тысяч ионов аминокислоты массой 150 Да и столько же - белка массой 15 000 Да. Аминокислота даст 2–3 основных, очень высоких пика, причем первый будет самым интенсивным, а белок - несколько десятков, но гораздо более низких, с вершиной этой пологой горки где-то посередине. Ясно, что высокую скалу, стоящую посреди ровной степи, заметить гораздо проще, чем маленький холмик, края которого еще и сливаются с высокой травой - техническим шумом, сопровождающим запись масс-спектра.

Итак, чувствительность масс-спектрометра характеризуется обратной зависимостью от молекулярной массы анализируемого соединения . Чем выше эта масса, тем менее интенсивен максимальный пик среди всех изотопных вариантов соединения. Кроме того, огромное количество этих пиков затрудняет интерпретацию масс-спектра. Вот почему в современной протеомике белки перед анализом чаще всего разлагают на пептиды молекулярной массой 500–2500 Да, обозначая такой подход «протеомикой снизу вверх» (bottom-up ). Именно такие пептиды удобно анализировать в масс-спектрометре. Расщепление белков обычно проводят наиболее специфичной из протеаз - трипсином , который с высокой специфичностью осуществляет протеолиз по пептидной связи правее остатков лизина и аргинина. Потребность в расщеплении белков я называю проклятием, поскольку при этом происходит потеря информации. В современных протеомных конвейерах, где такое расщепление производится без предварительного разделения, белки после анализа приходится собирать заново, разумеется, небезошибочно. Ситуация напоминает сборку нуклеотидных последовательностей после секвенирования нового поколения , но у последней есть преимущество, поскольку там фрагменты гораздо чаще перекрываются друг с другом.

Несмотря на огромную путаницу в масс-спектрах больших белков, многие исследователи продолжают работу с ними без расщепления. Такой подход называют протеомикой «сверху вниз» (top-down ). Для получения качественных масс-спектров целых белков используют мощные детекторы сверхвысокого разрешения. Тем не менее пока не удалось создать метод top-down , надежно и воспроизводимо анализирующий белки в масштабах целого протеома.

Масс-спектрометрия MALDI-TOF и пептидная дактилоскопия

В 1980-е годы в масс-спектрометрии стал развиваться подход к ионизации молекул лазером при их сокристаллизации со светочувствительным органическим веществом - так называемой матрицей. Матрица окружает молекулы анализируемого вещества, а при освещении лазером определенной длины волны она поглощает его энергию, ионизируется сама и способна - по не вполне ясному до сих пор механизму - эффективно ионизировать соседние молекулы вещества. Оказалось, что при некоторых условиях такой вид ионизации - опосредованная матрицей лазерная десорбция-ионизация (matrix-assisted laser desorption ionisation , MALDI ) - обеспечивает ионизацию биомолекул без их распада. Как только это стало ясно, метод ворвался в биологию, а одному из его авторов, который первым показал MALDI для белков, - японцу Коити Танаке - в 2002 году присудили Нобелевскую премию по химии . Ионизацию MALDI совместили с простым масс-спектрометрическим детектором - времяпролетным (time-of-flight , TOF ), в котором ионы летят в вакуумной трубе, достигая детектора в виде чувствительной к ионам пластины (фотоэлектронного умножителя) (рис. 7). Время, за которое ионы одного заряда преодолеют длину трубки, будет обратно пропорционально их молекулярной массе.

Обычно матрицы представляют собой низкомолекулярные органические кислоты, производные коричной, бензойной и других кислот.

Совместно с Джоном Фенном, применившим для биомолекул ионизацию электрораспылением, и Куртом Вютрихом (вообще за ЯМР). Примечательно, что исследование К. Танаки было обнародовано в виде патента, а его основная статья опубликована в скромном специализированном журнале Rapid Communications of Mass Spectrometry . Сам он - инженер-исследователь в частной компании - не имел ученой степени. Как и во многих других случаях, в присуждении премии Танаке было противоречие. Одновременно большой вклад в применения MALDI для белков внесли немцы Франц Гилленкамп и Михаэль Карас.

В 1990-е и в начале 2000-х простой и надежный MALDI-TOF-масс-спектрометр стал одной из рабочих лошадок протеомики. Как было сказано выше, основным методом разделения белков в масштабах протеома в то время был двумерный электрофорез. Если вырезать из геля пятно с белком некоторой степени очистки и расщепить связанный с гелем денатурированный белок трипсином, совокупность пептидов этого изолированного белка составит более или менее уникальный набор молекулярных масс - по крайней мере, в пределах отдельно взятого протеома. Это происходит, в первую очередь, из-за высокой специфичности трипсина и уникального распределения лизина и аргинина, по которым происходит расщепление, в разных последовательностях. Набор масс пептидов каждого белка напомнил исследователям об использовании для идентификации личности отпечатков пальцев, поэтому новый подход получил название масс-спектрометрического пептидного картирования , пептидного фингерпринта , или, как лучше сказать по-русски, пептидной дактилоскопии (рис. 8) .

Идея пептидной карты белка пришла к масс-спектрометрии через развившуюся к тому времени высокоэффективную жидкостную хроматографию . Очищенные белки могли расщепляться протеазой на пептиды, а их анализ на хроматографе давал уникальную пептидную карту. Если определить стандартизированное время выхода каждого из пептидов с хроматографической колонки, по такой хроматографической пептидной карте можно идентифицировать белок . Теперь такой параметр, как время выхода, решено было заменить на более точный и легко формализуемый показатель - определяемое в масс-спектрометре отношения массы к заряду пептидного иона.

Как же формально оценить соответствие наблюдаемого масс-спектра и теоретических представлений о последовательностях белков? Вначале необходимо «расщепить» все белки трипсином виртуально и составить из них базу данных для сравнения со спектрами. Вот тут протеомика и становится постгеномной - ведь без теоретических последовательностей комбинаций станет слишком много, и прогнозирование совпадения перестанет быть возможным. Далее необходим метод оценки вероятности того, что наблюдаемый набор пептидов относится к конкретному белку. В первом воплощении для решения этой задачи использовали подсчет вероятности того, что набор пиков не случаен. Если кто-то помнит из курса статистики, похожие вероятности высчитывают при изъятии из мешка вслепую шаров разных цветов. В нашем случае нужно ответить на вопрос, случайным ли образом насыпались в наш спектр из большого мешка всех возможностей шары-пептиды определенных масс? Если совпадение сильно не случайное, система присваивает нашему спектру высокий вероятностный коэффициент (score ).

Одним из первых алгоритмов для пептидной дактилоскопии стал MOWSE , который лег в основу широко известной специалистам программы Mascot . Хочу обратить внимание на важный момент в развитии протеомного анализа. С момента введения в обращение метода пептидной дактилоскопии идентификация белков и пептидов превратилась из измерения в предсказание. Таким образом, каждый идентифицированный таким методом белок характеризуется расчетным параметром вероятности того, что это действительно он. Когда мы красим гель антителами, наличие пятнышек на вестерн-блоте ничего подобного нам не скажет. Так протеомика вступила в эпоху «поисковых машин» - программ, которые сравнивают взятые из генома теоретические последовательности с наблюдаемыми масс-спектрами и возвращают вероятность того, что эти спектры получены из соответствующих белков и пептидов.

Пептидная дактилоскопия представляет собой метод анализа расщепленных белков. Параллельно MALDI-TOF стали использовать для исследования целых белков в сложных смесях - в анализе «сверху вниз». Белковые профили крови пациентов с разными заболеваниями, различные бактериальные и эукариотические клетки анализировали целиком и сравнивали полученные масс-спектры в разных группах для целей клинической диагностики и идентификации различных состояний. Масс-спектр использовали как образ, обучая алгоритмы известным случаям, и эффективно распознавая новые случаи. Если применение такого подхода для анализа белков крови в диагностике злокачественных опухолей оказалось недостаточно надежным для внедрения, метод анализа целых бактериальных клеток стал более успешным и сейчас используется в клиниках . Способы, реализуемые на очень простом масс-спектрометре, и прилагаемые к нему специально обученные алгоритмы способны идентифицировать до видов и родов патогенные микроорганизмы, причем анализ MALDI-TOF применяется к целым клеткам бактерий. Их наносят на металлическую мишень масс-спектрометра, покрывают матрицей и облучают лазером для получения специфичных профилей, распознаваемых алгоритмом по характерным массам.

Тандемные масс-спектры и протеомный поиск

Вытаскивание разноцветных шариков из пыльного мешка продолжилось, когда масс-спектрометры научились в мягких условиях фрагментировать пептиды. Внутри некоторых детекторов ионы пептидов и других соединений подвергаются специальным воздействиям, например, столкновению с незаряженными молекулами инертных газов, в результате чего эти ионы диссоциируют, образуя набор фрагментов (подробнее см. на рис. 9). После диссоциации массы фрагментов также можно измерить. Теперь, когда мы научились осуществлять тандемный анализ , или MS-MS , каждый пептид характеризуется массой иона-предшественника, который иногда называют «родительским» ионом, и набором масс ионов-фрагментов («дочерних» ионов).

Рисунок 9. Тандемная масс-спектрометрия. Схема метода - вверху . Основные типы фрагментов, которые образуются при диссоциации пептидов внутри масс-спектрометра - внизу . Поскольку пептиды имеют однотипную структуру, при подобранных условиях столкновительной диссоциации они разрушаются по определенным связям, в предсказуемой манере. Пептидная цепь может распадаться по связи между первым и вторым (альфа) атомами углерода в аминокислоте, образуя a- и x-ионы справа и слева от разорванной связи. Аналогично, при разрыве пептидной связи возникают b- и y-ионы, а при разрыве связи между атомом азота и α-атомом углерода - соответственно, с- и z-ионы.

Итак, из последовательности пептида можно предположить молекулярные массы образующихся из него при диссоциации в масс-спектрометре фрагментов основных типов. Подобно тому, как при пептидной дактилоскопии последовательность белка делится на пептиды, и массы теоретических пептидов сопоставляются с наблюдаемыми в спектре, здесь можно сопоставить теоретические фрагменты каждого виртуального пептида с наблюдаемыми пиками тандемного масс-спектра. Иначе говоря, весь кодирующий геном in silico делится на пептиды с помощью, например, трипсина, для каждого из них по известным эмпирическим правилам строится теоретический спектр фрагментации. Теперь такие теоретические масс-спектры можно сопоставить с настоящими и рассчитать каким-либо образом вероятность того, что это именно тот пептид. Единицей предсказания последовательностей из масс-спектров теперь становится пара теоретический пептид - настоящий спектр (peptide-spectrum match , PSM ). Очевидно, что многие спектры, особенно в случае большого протеома (например человеческого), могут образовывать пары с несколькими теоретическими пептидами, из которых надо выбрать лучшие.

Создание поисковых машин для тандемной масс-спектрометрии - огромная область, и таких инструментов разработаны десятки. Среди них, к счастью, есть программы с открытым кодом, и я сторонник использования в науке именно такого софта . Разбираться в тонкостях отсева правильных PSM в этой статье мы вряд ли сможем. Скажу только, что существенным достижением протеомного поиска по тандемным масс-спектрам стало изобретение в 2007 году подхода (рис. 10) , в котором к настоящим, геномным теоретическим пептидам (целевые - target ) при интерпретации масс-спектров стали добавлять равное количество специально образованных бессмысленных, поддельных пептидов (фальшивые - decoy ). Когда среди лучших PSM алгоритм начинает выдавать совпадение с заведомо несуществующими пептидами, мы можем остановить процесс и определить уровень ложноположительных результатов (FDR) в наших протеомных данных. То есть в наших предсказаниях всегда есть небольшая примесь вранья, что неизбежно при протеомных поисках такого типа. Нормально то, что мы хотя бы можем оценить долю ложных идентификаций.

Не хотелось бы очернять чей-то бизнес, но использовать в науке дорогой инструмент, не зная, как он работает, на мой взгляд, противоречит самой идее развития научной мысли.

Рисунок 10. Принцип подтверждения результатов протеомного поиска . Проверка гипотез о совпадении настоящего спектра с теоретическим приводит к образованию пар спектр-пептид (PSM). Алгоритм поиска приписывает каждому реальному спектру лучший, по его мнению, пептид. Но авторы метода схитрили - они добавили к теоретическим спектрам настоящих пептидов (target ) фальшивые, заведомо неподходящие (decoy ). И вот когда спектрам начинают соответствовать decoy-пептиды, это явные ошибки, то есть ложноположительные результаты. Мы ждем, когда доля PSM с этими decoy - так называемый уровень ложноположительных результатов (FDR) - достигает определенной величины (обычно, это 1%), и поиск прекращаем. Теперь мы примерно знаем, сколько ошибок у нас среди «правильных» идентификаций PSM, ведь вероятность ошибиться в сторону target равно таковой в сторону decoy.

Изобретение приемлемого MS/MS пептидов и появление способов обработки таких данных дала возможность для доставки в масс-спектрометр смесей пептидов без разделения целых белков. То есть появилась возможность расщепить все белки в образце протеазой и оперировать уже совокупностью пептидов, а не белков. Появилась протеомика-«дробовик» (shotgun proteomics ), которую для благозвучия, в ущерб точности, переводят на русский язык как скорострельную или панорамную .

Ионизация электрораспылением и скорострельная протеомика

Одним из обладателей «нобелевки» 2002 года, о которой я упоминал выше, стал американский химик Джон Фенн . Ранее он предложил использовать в масс-спектрометрии метод ионизации электрораспылением , или, как его еще называют, электроспреем (electrospray ionisation , ESI ). При приложении высокого напряжения к выходящей из конического капилляра жидкости она превращается в аэрозоль, а при испарении жидкости из частиц аэрозоля (например, в потоке инертного газа) электрический заряд может переходить на растворенные в этом аэрозоле биомолекулы. Так обеспечивается мягкая ионизация при атмосферном давлении, которая почти не фрагментирует высокомолекулярные соединения, в отличие от многих бытовавших ранее способов ионизации. Не лишенный британского чувства юмора Фенн в своих статьях и лекциях аллегорически сравнивал биомолекулы, которые он заставил воспарить с помощью своего метода, с летающими слонами (рис. 11).

Ионизация электрораспылением оказалась необычайно удобной для совмещения двух важных методов аналитической биохимии - высокоэффективной жидкостной хроматографии и масс-спектрометрии . Теперь поток хроматографической фазы с аналитической колонки можно было направить в конус для электрораспыления, или организовать такой конус на конце колонки, и применять масс-спектрометр как анализатор разделяемых в колонке молекул. Возможность осуществлять тандемную масс-спектрометрию вместе с развитием протеомного поиска с середины 2000-х сделали комбинацию методов под многоэтажной аббревиатурой HPLC-ESI-MS/MS , или просто LC-MS/MS , предпочтительным способом исследования протеома. Это и есть та самая скорострельная протеомика (рис. 12). Небольшое огорчение доставило то, что для ее осуществления, как правило, приходится расщеплять целый протеом или его фракции на трипсиновые пептиды с потерей при этом информации о целостных белках. Однако бонусов от введения этого подхода оказалось намного больше.

Большим подспорьем для роста информативности скорострельной протеомики оказалась «демократизация» масс-спектрометров с высоким разрешением. Ранее для особо высокого разрешения и точности определения требовалось построение приборов ионно-циклотронного резонанса с преобразованием Фурье, в которых использовали могучие сверхпроводящие магниты с индукцией магнитного поля свыше 7 Тесла. В последнее десятилетие детекторы других типов достигли сопоставимых показателей. Примерами таких приборов служат гибридные детекторы разных производителей, например, квадрупольно-времяпролетные масс-спектрометры (Q-TOF ). Главенствующее положение среди доступных масс-спектрометров занимает появившаяся на рынке в 2005 году ионная ловушка особого типа - Orbitrap (рис. 13). Приятную гордость пробуждает тот факт, что создатель этой ловушки - российский физик, работающий в компании Thermo, выпускник МИФИ Александр Макаров .

Действие патента на Orbitrap, принадлежащего компании Thermo, в ближайшее время истечет, так что мы можем ожидать дальнейшего снижения цены на детекторы этого типа.

Точность определения молекулярной массы в запусках рутинного протеомного анализа достигла показателя 5 частей на миллион (то есть 0,0005%) и ниже. Это привело к значительному прогрессу в числе идентифицируемых таким образом белков протеома. Сегодня лучшие научные группы сообщают об идентификации методом скорострельной протеомики в клеточных линиях и тканях человека белковых продуктов 9–10 тысяч генов, то есть почти половину всего кодирующего генома . Справедливо указать, что эти цифры достигаются на уровне 1% ложноположительных результатов.

Количественный анализ и изотопные метки

Просто идентифицировать белки протеомным методом в большинстве случаев явно недостаточно. Для познания механизмов биологических процессов необходимы количественные данные, обеспечивающие сравнение протеомов клеток и тканей в разных состояниях. Проще всего проанализировать некоторые показатели получившихся в ходе запусков системы LC-MS/MS хроматограмм, снабженных спектральными данными. Такой подход называется безметковым (label-free quantitation , LFQ ), поскольку не требует специальных модификаций метода пробоподготовки. Например, в контрольном образце от всех пептидов некоторого белка зарегистрировано 200 спектров, а в опытном - 400. Можно предположить, что число записанных спектров пропорционально концентрации белка в образце. Для сравнения используют и другие параметры спектров, например, нормированные значения интенсивности сигнала. Безметковый количественный анализ по протеомным данным привлекателен своей простотой, и для него выработано большое количество программных решений, в том числе бесплатных программ с открытым доступом, среди которых сегодня наиболее популярен разработанный группой Матиаса Манна из Германии пакет MaxQuant . Безметковые методы неточны и полуколичественны, а находки, сделанные с их помощью, требуется проверять другим способом, например, с использованием вестерн-блоттинга .

Иное дело, когда один из анализируемых образцов или все они подвергаются мечению с помощью тех же стабильных изотопов, о которых уже шла речь выше. Тогда в масс-спектре пики одной и той же химической природы, но содержащие разное количество стабильных изотопов, будут стоять в спектрах рядом, разделенные расстоянием по оси m/z в зависимости от использованной метки. Мы можем сравнить интенсивность стоящих рядом пиков опыта и контроля и точно рассчитать отношение концентраций соответствующих пептидов и белков.

Разработано большое количество технических решений, позволяющих проводить изотопное мечение. В случае, когда возможно культивирование клеток в искусственных средах, можно пометить все клетки одной группы анализа, используя изотопно меченные среды. В ряде случаев метки вводят при расщеплении трипсином. Существуют метки, проявляющие себя на ионах-предшественниках, а также на ионах фрагментов. Последние зачастую позволяют проводить количественный анализ в мультиплексном режиме, например, набор TMT-меток от компании Thermo предоставляет одновременную обработку разными метками 11 образцов! Использование изотопных меток существенно повышает аналитическую точность количественного анализа, который в ряде случаев может стать абсолютным, то есть определять точные концентрации анализируемых соединений. Однако существенный недостаток в этом случае - цена анализа .

Стоимость набора для мечения нескольких образцов может примерно составлять средний размер гранта РФФИ (!) - для тех, кто знает.

Направленный анализ пептидов - мониторинг множественных реакций

Наконец стоит упомянуть о методе протеомного анализа, который по своей функции составляет конкуренцию методам определения белков при помощи антител. Когда мы знаем, какой пептид, характеризующий целый белок, хотим измерить, можно настроить масс-спектрометр так, чтобы он видел, по сути, только этот пептид. Таким образом, работу проводят в направленном (таргетном) режиме. Для этого используют прибор с детектором типа тройного квадруполя. По сути, это три одинаковых масс-спектрометра, стоящих друг за другом и передающих друг другу ионы. В первом отфильтровывается нужный ион-предшественник, то есть интересующий нас пептид, во втором - куда попал только наш «товар» - он проходит фрагментацию, а третий регистрирует 3–5 выбранных нами заранее фрагментов. По интенсивности фрагментов осуществляется количественный анализ.

Подход известен из анализа низкомолекулярных соединений и начал широко использоваться для пептидов в середине 2000-х под названием «мониторинг множественных реакций » (multiple reaction monitoring , MRM ), или «мониторинг выбранных реакций » (selected reaction monitoring , SRM ) (рис. 14) . Такой метод не подходит для обнаружения новых явлений в протеоме, но зато обеспечивает надежный количественный анализ, особенно с использованием синтетических изотопно меченных стандартов для интересующих пептидов. MRM позволяет осуществлять анализ нескольких пептидов за один запуск LC-MS/MS. Он позиционируется как «масс-спектрометрический иммунный анализ» и в настоящее время ищет свое место не только в науке, но и в клинической и биотехнологической практике.

Протеомика с помощью антител и других связующих молекул

С совершенствованием точного нанесения жидкости на подложку, иными словами, печати микрочипов различных типов, иммунные тесты на белки смогли стать миниатюрными. Одновременно с чипами для гибридизации нуклеиновых кислот возникло множество технических решений размещения на твердых подложках сотен и более антител к различным белкам. Такое умножение известных иммунных тестов в сочетании с различными остроумными методами визуализации связывания белка-мишени перевело известный до этого анализ в режим протеомного. Детектирование белков в множественном режиме с помощью специфичных связывающих молекул (например, антител и их фрагментов) к настоящему моменту приобрело столь разнообразные формы, что для их описания, наверное, требуется создать отдельный материал. Я не специалист в области белковых микрочипов, поэтому предоставлю сделать это кому-нибудь еще.

Следует упомянуть несколько технических решений в этой области. В нашей стране группа под руководством А.Д. Мирзабекова около 20 лет назад создала микрочипы на основе гидрогеля, в том числе для анализа белков , причем эта технология до сих пор развивается в Институте молекулярной биологии РАН. Альтернативой антителам для мультиплексного анализа белков служат аптамеры - связующие олигонуклеотиды. На основе химически модифицированных аптамеров американская компания Somalogic создала микрочипы для анализа более тысячи белков человека. Такие чипы всё чаще используют для поиска биомаркеров, как альтернатива масс-спектрометрической протеомике.

Если говорить об антителах для анализа белков в масштабе целого генома, то нельзя не упомянуть мощный по объему шведский проект под руководством Матиаса Улена - «Атлас белков человека ». В ходе этого проекта к большинству человеческих белков получили антипептидные поликлональные антитела, которыми затем покрасили большое количество тканей и клеток. Ценой существенных усилий создали большую базу данных, содержащую диаграммы и изображения, иллюстрирующие синтез большинства белков генома в различных органах и тканях

При взаимодействии анализируемых молекул с биосенсором происходит изменение преломления светового пучка внутри биосенсора, которое регистрируется прибором и отображается на мониторе компьютера в виде кривых ассоциации-диссоциации.

Что дальше?

В конце полагается очертить перспективы того направления, о котором пишешь. Сивилла из меня не очень - что будет дальше, на самом деле, я не знаю. Но скажу. Все омиксы ждет демократизация - техника станет работать еще лучше, а стоимость анализа будет снижаться . Конечно, с масс-спектрометрией дело не дойдет до решений, похожих на секвенатор нуклеиновых кислот на основе нанопоры , который уже стоит совсем небольших денег. Все-таки там требуется вакуум, который создают насосом. Ну и прочая электроника.

Пробы будут подвергаться сразу нескольким видам омиксного анализа. Даже сегодня в некоторых областях, например при молекулярной характеристике опухолей, образцы стремятся обследовать всесторонне , в режиме так называемой протеогеномики . Это нужно для улучшенной классификации образцов, которая может обеспечить более эффективное управление заболеванием.

Снятие молекулярных показателей с гомогенизированных тканей, содержащих миллионы или, как минимум, тысячи клеток, напоминает оценку средней температуры по больнице. Если среди тысяч клеток десятки содержат уникальные белки, важные мишени для лекарств, биомаркеры или другой функционал, при таком анализе сигнал от них просто потеряется. Поэтому должна развиваться протеомика единичных клеток . Надо отметить, что ей гораздо сложнее это сделать, чем, например, транскриптомике, поскольку сигнал от белков нельзя амплифицировать, как нуклеиновые кислоты в полимеразных цепных реакциях.

Что ещё важно: уже сейчас данные, которые получает масс-спектрометр, очень велики - это, похоже, Big Data. И они явно недостаточно интерпретированы. Тенденция ближайшего времени - повышение информационного содержания протеомных данных. В немного переосмысленном виде будет действовать пословица: «Двое с сошкой (люди, проводящие эксперименты и получающие данные), семеро с ложкой (компьютерщики, которые эти данные обрабатывают)». А первых двоих лучше вообще убрать, пусть за них работают роботы. Айтишники будут лежать на пляже с ноутбуками (они это любят) и посылать мне обработанные данные, а я - сидеть на завалинке где-нибудь в русской деревне (это уже люблю я) и писать о протеомах.

И последнее. Исследователи - народ строгий. Потому ожидаю некоторые критические замечания к этому тексту, который ни в коем случае не всеобъемлющ. Возможно, в статье также притаились фактические и технические ошибки. Прошу всех высказывать свое мнение в комментариях и лично, мы открыты к сотрудничеству и обязательно поправим текст в случае обоснованной критики.

Календарь

Итак, главной задачей протеомики является выявление механизма взаимодействия огромного числа белков и пептидов в одном организме. Какова же практическая значимость этой грандиозной и дорогостоящей работы? Очевидно, что в первую очередь в результатах такой работы заинтересованы фармакологи и медики, поскольку очень часто прослеживается тесная связь между изменениями в белковом составе и болезненным состоянием человека. Поэтому новые данные в протеомике будут использоваться (и уже используются) для быстрой разработки новых лекарственных средств и новейших методов лечения болезней, с которыми медицина боролась веками. На сегодняшний день 95% всех фармакологических средств воздействуют на белки. Протеомика со своим системным подходом может помочь идентифицировать и оценить важность появления новых белков гораздо эффективнее, что, в свою очередь, ускорит разработку новых диагностических тестов и терапевтических средств.

Первое практическое применение протеомных исследований состоялось задолго до появления термина «протеомика», еще в начале XX в., когда была обнаружена роль инсулина в развитии такого тяжелого заболевания, как диабет. Создание инсулиновых препаратов спасло жизнь миллионам людей.

В настоящее же время протеомика, вместе с геномикой и биоинформатикой, ориентирована на создание новых лекарственных препаратов (рис. 18), в которых молекулярными мишенями будут служить те или иные белки . Процесс нахождения новых мишеней для действия лекарств решается с помощью биоинформатики, причем объектом анализа является геном. Однако после анализа генома необходимо получить доказательства того, что данный белок интенсивно экспрессируется и находится в клетке в рабочем состоянии. Эту задачу решает протеомика. Таким образом выявляется молекулярная генетическая мишень для лекарства.

Следует отметить, что протеомика может и сама по себе решать проблему нахождения мишени. Если получить протеомные карты (подобные тем, что представлены на рис. 3 или 4) нормальных и патологических тканей, то по различиям в них можно установить, какие белки важны для развития того или иного патологического состояния, и выбрать их в качестве мишеней или использовать эти знания для диагностики. Можно предположить, что в будущем к обычному анализу крови добавится создание протеомных карт крови. Для этого в поликлиниках необходимо будет использовать специальное оборудование, с помощью которого у пациентов периодически будут брать кровь. При возникновении болезненного состояния протеомную карту больного человека нужно будет всего лишь сравнить с его же протеомной картой, но составленной в то время, когда он был здоров, и можно будет выявить произошедшие изменения в белковом составе крови и определить причину заболевания. Подобное сравнение протеомов опухолевых и нормальных клеток, клеток до и после воздействия определенных факторов (например, физических или химических), использование биологических жидкостей в диагностических целях – все это представляет огромный интерес и открывает совершенно новые перспективы для медицины, ветеринарии, фармакологии, пищевой промышленности и других прикладных областей. Впереди предстоит огромная и интересная работа.

Библиография

1.Sanger F., Air G.M., Barrell B.G., Brown N.L. et al. Nucliotide sequence of bacteriophage phi X-174 DNA.//Nature. 1977. V. 265, № 5596. P. 687–695.

2.Fleischmann R.D., Adams M.D., White O. et al. Whole-genome random sequencing and assembly of Haemophilus influenzae Rd.//Science. 1995. V. 269, № 5223. P. 496–512.

3.Nature. 2001. 409, № 6822 (большая часть выпуска журнала посвящена расшифровке генома человека).

4.Ferguson-Smith A.C., Ruddle F.H. The genomics of human homeobox-containing loci.//Pathol. Immunopathol. Res. 1988. V. 7, № 1–2. P. 119–126.

5.Franklin J. Bioinformatics changing the face of information.//Ann. NY Acad. Sci. 1993. V. 700. P. 145–152.

6.Wasinger V.C., Cordwell S.J., Cerpa-Poljak A. et al. Progress with gene-product mapping of the Mollicutes: Mycoplasma genitalium.//Electrophoresis. 1995. V. 16, № 7. P. 1090–1094.

7.Замятнин А.А. Блистающий мир белков и пептидов.//Биология. 2002. № 25–26. P. 8–13.

8.Gorg A., Weiss W., Dunn M.J. Current two-dimensional electrophoresis technology for proteomics.//Proteomics. 2004. V. 4, № 12. P. 3665–3685.

9.Ramstrom M., Bergquist J. Miniaturized proteomics and peptidomics using capillary liquid separation and high resolution mass spectrometry.//FEBS Lett. 2004. V. 567, № 1. P. 92–95.

10. http://au.expasy.org/sprot/

11 http://erop.inbi.ras.ru/

12. Малыгин А.Г. Метаболизм карбоновых кислот (периодическая схема). – М.: «Международная программа образования», 1999.

13. Арчаков А.И. Что за геномикой? – Протеомика.//Вопр. мед. химии. 2000. Т. 46, № 4. С. 335–343.

14. ru.wikipedia.org/wiki/Протеомика

15. www.biomed.spbu.ru/equipment/proteomics/

16. thesaurus.rusnano.com/wiki/article1579

17. www.inbi.ras.ru/ubkh/49/Terentiev.pdf

18. www.strf.ru/material.aspx?CatalogId=352&d_no=11979

19. www.textronica.com/lcline/proteomics/proteomics.html

20. www.bionet.nsc.ru/bioinf/files/proneomika.pdf

21. www.bionet.nsc.ru/bioinf/files/proneomika.pdf

А.А. ЗАМЯТНИН, доктор биологических наук, Институт биохимии им. А.Н.Баха РАН

Наш рассказ будет посвящен одной из самых молодых фундаментальных наук (если не самой молодой), которая родилась всего лишь несколько лет назад вместе с теми, кто еще сейчас учится в начальной школе. В отличие от многих других наук о протеомике можно точно сказать, при каких обстоятельствах она возникла, указать год, когда появилось ее название и кто его придумал.

Начнем с обстоятельств. Во второй половине XX в. бурно развивались аналитические методы биохимии, молекулярной биологии и вычислительной техники. Выдающиеся успехи, достигнутые в этих областях, привели к возможности расшифровки огромных последовательностей оснований нуклеиновых кислот и к записи полного генома живого организма. Впервые полный геном был расшифрован в 1980 г. у бактериофага phi Х-174 (около 5·103 оснований), затем у первой бактерии – Haemophilus influenzae (1, 8·106 оснований) . А c завершением XX в. была закончена грандиозная работа по расшифровке полного генома человека – выявлению последовательности примерно 3 млрд оснований нуклеиновых кислот . На эту работу было затрачено несколько миллиардов долларов (примерно по одному доллару на одно основание). Всего же уже расшифрованы геномы нескольких десятков видов живых организмов. Именно в этот период возникли две новые биологические науки: в 1987 г. впервые в научной печати было использовано слово «геномика» , а в 1993 г. – «биоинформатика» .

У каждого биологического вида часть генома представлена участками, кодирующими аминокислотные последовательности белков. Например, таких участков у человека насчитывается порядка 100 000 (по некоторым оценкам, это число может достигать 300 000, а с учетом химически модифицированных структур – нескольких миллионов). Казалось бы, зная полный геном и генетический код, можно путем трансляции получить все сведения о структуре белков. Однако все не так просто. Постепенно становилось очевидным, что в данной рассматриваемой клеточной системе организма нет корреляции между наборами мРНК и белков. Кроме того, многие белки, синтезированные на рибосомах в соответствии с нуклеотидной последовательностью, после синтеза подвергаются химическим модификациям и могут существовать в организме в модифицированной и немодифицированной формах. И еще немаловажно то, что белки обладают разнообразными пространственными структурами, которые на сегодняшний день нельзя определить по линейным последовательностям нуклеотидов и даже аминокислот. Поэтому прямое выделение и определение структур всех функционирующих белков остается по-прежнему актуальной задачей (прямое определение структуры на сегодняшний день осуществлено примерно лишь для 10% белков человека). Так, в дополнение к геномике появился термин «протеомика», объектом исследования которой является протеом (от англ. PROTEins – белки и genOMe – геном). А в научной печати упоминание о протеоме впервые появилось в 1995 г. .

Следует добавить, что большую роль в жизнедеятельности организмов играют многочисленные короткие фрагменты белковых предшественников, которые называются олигопептидами, или просто пептидами. Именно из-за них наблюдается такой разнобой в оценке количества белково-пептидных компонентов у представителей одного биологического вида. Поэтому наряду с терминами «протеом» и «протеомика» в настоящее время уже употребляются такие термины, как «пептидом» и «пептидомика», представляющие собой часть протеома и протеомики. О многообразии структуры и функций белков и пептидов на страницах газеты «Биология» нами было рассказано ранее .

Итак, сформулируем определения новых наук, которые появились при жизни нынешнего молодого поколения и которые тесно взаимосвязаны друг с другом (рис. 1).

Рис. 1. Схема, иллюстрирующая полную взаимосвязь трех новых биологических наук

Геномика – наука, занимающаяся изучением структуры и функций генов (геном – совокупность всех генов организма).

Биоинформатика – наука, занимающаяся изучением биологической информации с помощью математических, статистических и компьютерных методов.

Протеомика – наука, занимающаяся изучением совокупности белков и их взаимодействий в живых организмах (протеом – совокупность всех белков организма).

Отметим также, что протеомика в общих чертах включает в себя структурную протеомику, функциональную протеомику и прикладную протеомику, которые мы рассмотрим в отдельности.

Структурная протеомика

Наиболее яркой особенностью биологии является разнообразие. Оно просматривается на всех уровнях биологической организации (биологические виды, морфология, химическая структура молекул, сеть регуляторных процессов и т.д.). В полной мере это относится и к белкам. Масштаб их структурного разнообразия до сих пор до конца не выявлен. Достаточно сказать, что число аминокислотных остатков в одном белке может составлять от двух (минимальная структура, имеющая пептидную связь) до десятков тысяч, а белок титин человека содержит 34 350 аминокислотных остатков и на сегодняшний день является рекордсменом – самой крупной из всех известных белковых молекул.

Чтобы получить сведения о протеоме, необходимо сначала его выделить и очистить от других молекул. Поскольку число белков во всем протеоме (т.е. во всем организме) весьма велико, обычно берут только часть организма (его орган или ткань) и различными методами выделяют белковую компоненту. За почти 200-летнюю историю изучения белков разработано множество методов выделения белков – от простого солевого осаждения до современных сложных методов, учитывающих различные физические и химические свойства этих веществ. После получения чистой фракции индивидуального белка определяется его химическая структура.

В структурной протеомике проводится определение структуры не одного, а сразу множества белков, и к настоящему времени для этого разработан специальный цикл процедур и создан арсенал соответствующих высокоточных приборов. (Полный набор оборудования для протеомных исследований стоит более одного миллиона долларов.)

Рис. 2. Инструменты протеомики

На рис. 2 приведена схема лабораторного цикла от приготовления образца до определения его структуры. После выделения и очистки (на рисунке представлен уже выделенный и очищенный препарат) с помощью двумерного электрофореза проводится разделение белков. Это разделение идет по двум направлениям: в одном разделяются молекулы белка, имеющие разную массу, в другом – различный суммарный электрический заряд. В результате этой тончайшей процедуры на специальном носителе одинаковые молекулы группируются, образуя макроскопические пятна, причем в каждом пятне содержатся только одинаковые молекулы. Число пятен, т.е. число разных белков или пептидов, может составлять многие тысячи (рис. 3, 4), и для их исследования используются автоматические устройства для обработки и анализа. Затем проводится отбор пятен и введение содержащихся в них веществ в сложнейший физический прибор – масс-спектрометр, с помощью которого и определяется химическая (первичная) структура каждого белка.

Рис. 3. Пример двумерной электрофореграммы белков из экстракта печени мыши

Рис. 4. Пример двумерной электрофореграммы пептидов из цереброспинальной жидкости человека

Рис. 5. Нуклеотидная последовательность гена, кодирующего сывороточный альбумин человека

Первичную структуру белка можно также определить, пользуясь результатами геномики и биоинформатики. На рис. 5 дана полная структура гена сывороточного альбумина человека. Она содержит 1830 азотистых оснований, кодирующих 610 аминокислотных остатков. Этот ген, как и абсолютное большинство других, начинается с кодона atg, кодирующего остаток метионина, и заканчивается одним из стоп-кодонов, в данном случае taa. Таким образом кодируется структура, состоящая из 609 аминокислотных остатков (рис. 6). Однако эта структура – молекула еще не сывороточного альбумина, а лишь его предшественника. Первые 24 аминокислотных остатка представляют собой так называемый сигнальный пептид, который при переходе молекулы из ядра в цитоплазму отщепляется, и только после этого образуется структура сывороточного альбумина, получаемая при выделении этого белка. В итоге данная молекула содержит 385 аминокислотных остатков.

Рис. 6. Аминокислотная последовательность предшественника сывороточного альбумина человека, транслированная с нуклеотидной последовательности с помощью генетического кода

Рис. 7. Пространственная (третичная) структура молекулы сывороточного альбумина человека

Однако аминокислотная последовательность не раскрывает пространственную структуру белка. С точки зрения термодинамики, вытянутая линейная структура энергетически невыгодна, и поэтому она специфическим для каждой последовательности образом сворачивается в уникальную пространственную структуру, которая может быть определена с помощью двух мощных физических методов – рентгеноструктурного анализа и метода ядерного магнитного резонанса (ЯМР-спектроскопии). С помощью первого из них определены пространственные структуры уже нескольких тысяч белков, в том числе и сывороточного альбумина человека, изображение которого представлено на рис. 7. Эта структура, в отличие от первичной (аминокислотной последовательности), называется третичной и в ней хорошо видны спирализованные участки, являющиеся элементами вторичной структуры.

Таким образом, задача структурной протеомики сводится к выделению, очистке, определению первичной, вторичной и третичной структур всех белков живого организма, а ее основными средствами являются двумерный электрофорез, масс-спектрометрия и биоинформатика.

Биоинформатика белков

Существование огромного количества разнообразных белков привело к необходимости создания информационных массивов – баз (или банков) данных, в которые заносились бы все известные о них сведения. В настоящее время существует множество общих и специализированных баз данных, которые доступны в Интернете каждому желающему. В общих базах содержатся сведения о всех известных белках живых организмов, т.е. о глобальном протеоме всего живого. Примером такой базы является SwissProt-TrEMBL (Швейцария–Германия), в которой на сегодняшний день содержатся структуры почти 200 000 белков, установленные аналитическими методами, и еще почти 2 млн структур, которые определены в результате трансляции с нуклеотидных последовательностей . На рис. 8 и 9 показано количество существующих белков, которые известны для каждого заданного числа аминокислотных остатков. Оси абсцисс на этих графиках ограничены 2000 остатков, но, как уже сказано выше, хотя и не часто, но встречаются и существенно более крупные молекулы. Из данных, представленных на рисунках, следует, что наибольшее число белков содержит по несколько сотен аминокислотных остатков. К ним относятся ферменты и другие достаточно мобильные молекулы. Среди более крупных белков много таких, которые выполняют опорную или защитную функции, скрепляя биологические структуры и придавая им прочность.

Рис. 8. Распределение известных (выделенных) белков по числу аминокислотных остатков

Рис. 9. Распределение транслированных аминокислотных последовательностей по числу минокислотных остатков

Рис. 10. Распределение известных природных олигопептидов по числу аминокислотных остатков

В глобальном протеоме особое место занимают небольшие очень подвижные молекулы, содержащие не более 50 аминокислотных остатков и обладающие специфическим спектром функциональной активности. Они называются олигопептидами, или просто пептидами. Для них, т.е. для глобального пептидома, создан особый банк данных, который называется EROP-Moscow. Это название представляет собой аббревиатуру от термина Endogenous Regulatory OligoPeptides (эндогенные регуляторные олигопептиды), и указывает на то, что банк создан и базируется в столице нашей страны . На сегодняшний день расшифрована структура почти 6000 олигопептидов, выделенных из представителей всех царств живого. Так же как и крупные белки, количество олигопептидов с заданным числом аминокислотных остатков можно изобразить графически (рис. 10). Судя по графику, чаще всего встречаются олигопептиды, содержащие примерно 8–10 аминокислотных остатков. Среди них в основном содержатся молекулы, которые участвуют в регуляции нервной системы, и поэтому называются нейропептидами. Очевидно, что самые быстрые процессы в живом организме осуществляются с участием нервной системы, поэтому пептидные регуляторы должны быть мобильными и следовательно небольшими. Однако, следует отметить, что, ввиду огромного структурного и функционального разнообразия как белков, так и пептидов, для них до сих пор не создано строгой классификации.

Таким образом, в данном случае задачами биоинформатики являются накопление информации о физико-химических и биологических свойствах белков, анализ этой информации, каталогизация и подготовка информационной базы и вычислительных средств для выявления механизмов их функционирования.

Функциональная протеомика

Наличие в организме того или иного белка дает основание предполагать, что он обладает (или обладал) определенной функцией, а весь протеом служит для того, чтобы осуществлялась полноценная жизнедеятельность всего организма. Функциональная протеомика занимается определением функциональных свойств протеома, и решаемые ею задачи существенно сложнее, чем, например, определение белково-пептидных структур.

Очевидно, что функционирование протеома осуществляется в многокомпонентной среде, в которой присутствует множество молекул других химических классов – сахаров, липидов, простагландинов, различных ионов и многих других, включая молекулы воды. Не исключено, что через некоторое время появятся такие термины, как «сахаром», «липидом» и им подобные. Белковые молекулы взаимодействуют с окружающими их другими или такими же, как и они, структурами, что в конечном итоге приводит к возникновению функциональных реакций сначала на молекулярном уровне, а затем и на макроскопическом. Уже известно множество таких процессов, в том числе с участием белков. Среди них взаимодействие фермента с субстратом, антигена с антителом, пептидов с рецепторами, токсинов с ионными каналами и т.д. (рецепторы и ионные каналы также являются белковыми образованиями). Для выявления механизмов этих процессов проводятся как экспериментальные исследования индивидуальных участников взаимодействия, так и системные исследования средствами биоинформатики. Рассмотрим несколько примеров таких системных подходов.

На рис. 11 показаны представители протеома (в данном случае пептидома) человека – различные гастрины и холецистокинины, которые локализованы в желудочно-кишечном тракте (при написании аминокислотных последовательностей использован стандартный однобуквенный код, расшифровка которого была дана нами ранее ). Функциональными частями молекул этих пептидов являются очень схожие правые области. Однако пептиды обладают прямо противоположными поведенческими свойствами: гастрины вызывают у человека ощущение голода, а холецистокинины – сытости. По-видимому, данное различие обусловлено тем, что в первичной последовательности холецистокининов положение остатка тирозина Y сдвинуто на один шаг по сравнению с гастринами. На том же рисунке приведена первичная структура пептида ционина, полученного из представителя простейших хордовых Ciona intestinalis (рис. 12). Его структура гомологична и гастринам, и холецистокининам и характеризуется двумя остатками тирозина, находящимися в тех же положениях, что и у обоих указанных пептидов. К сожалению, функциональные свойства его не изучены. А при должном экспериментальном исследовании можно было бы ответить на вопрос, какова роль химической структуры в целом и остатков тирозина в частности при проявлении противоположных физиологических эффектов.

Рис. 11. Первичные структуры представителей пептидома человека в сравнении со структурой одного из пептидов оболочечника

Рис. 12. Оболочечник Ciona intestinalis, обитающий в Северном море

Другой пример: на рис. 13 приведены аминокислотные последовательности очень похожих молекул, которые также объединены в структурно-гомологичное семейство. Эти молекулы обнаружены у весьма эволюционно далеких живых организмов – от насекомых до млекопитающих. В первой строке дана первичная структура брадикинина, содержащего 9 аминокислотных остатков и встречающегося у многих высших организмов, в том числе и у человека. В течение многих лет химики синтезировали различные неприродные аналоги этой молекулы, чтобы ответить на вопрос, какой ее участок ответственен за взаимодействие с рецептором. Около 30 лет назад были даже синтезированы все возможные фрагменты брадикинина – 8 дипептидов, 7 трипептидов и т.д. (всего возможны 36 фрагментов), величину активности которых затем испытывали в одном и том же биологическом тесте. Результат оказался тривиальным: выяснилось, что максимальную активность проявляет лишь вся молекула целиком, а каждый фрагмент по отдельности обладает либо следовой активностью, либо нулевой. Эту трудоемкую работу не пришлось бы делать, если бы в то время были известны другие брадикинины, приведенные на рис. 13, и средствами биоинформатики они были бы выделены из глобального протеома. Представленное структурно-гомологичное семейство наглядно демонстрирует, что у всех молекул есть область, которая в результате биологической эволюции практически не изменялась (квазиконсервативная область), и она представляет собой молекулу брадикинина высших живых организмов, отобранную как наиболее совершенную в результате эволюционного процесса. Данный пример демонстрирует, что протеомика вместе с биоинформатикой позволяет быстро (и дешево) решать принципиальные научные проблемы.

Рис. 13. Первичные структуры природных пептидов брадикининов, полученных из разных живых организмов. Жирным шрифтом указаны квазиконсервативные области

Рис. 14. Первичные структуры структурно-гомологичного семейства эндотелинов / токсинов

И, наконец, третий пример – структурно-гомологичное семейство эндотелинов млекопитающих и токсинов змей (рис. 14). Несмотря на поразительное сходство структур, их функциональные свойства разительно отличаются друг от друга: одни являются очень полезными регуляторами сосудистого сокращения, а другие – смертельно опасны для жизни. В данном случае мы сталкиваемся с ситуацией, когда первичная структура не несет достаточной информации, способной объяснить причину различия функций, и необходимо более детальное рассмотрение пространственной (третичной) структуры. На рис. 15 и 16 показаны пространственные структуры двух представителей этого семейства – эндотелина-1 и сарафотоксина 6b, полученные с помощью ЯМР-спектроскопии. На рисунках они повернуты так, чтобы достичь максимальной пространственной гомологии. Но полной гомологии не удается получить ни при каком повороте. Следовательно, несмотря на большое сходство первичных структур, взаимодействие их осуществляется с разными рецепторными структурами, а потому и приводит к разным физиологическим эффектам.

Рис. 15. Пространственная структура сосудосокращающего пептида эндотелина-1 человека

Рис. 16. Пространственная структура сарафотоксина 6b израильской змеи Atractaspis engaddesis

Конечно столь частными примерами невозможно полностью охарактеризовать многообразие функциональной протеомики. Создание представлений об огромной сети взаимодействий белковых и других молекул в организме требует огромного труда и применения всех средств современной биоинформатики. По существу, создание таких представлений еще только начинается. Однако есть основание полагать, что с каждым годом наши познания в этой области будут быстро расти.

Рис. 17. Общие контуры карты метаболизма карбоновых кислот

Одним из первых успехов на этом пути является создание карты метаболизма карбоновых кислот в Институте биохимии им. А.Н. Баха Российской академии наук (рис. 17). Эта карта представляет собой сеть реакций с регулярным периодическим строением. Такой подход оказался успешным ввиду того, что функционально аналогичные метаболиты претерпевают сходные биохимические превращения, образуя функционально аналогичные производные. В карте по вертикали расположены области, содержащие соединения с одинаковым числом атомов углерода (от 1 до 10), а горизонтальные ряды представляют собой ряды функционально аналогичных метаболитов. Химические структуры на карте соединены многочисленными стрелками с указанием, какие ферменты (белки) участвуют в соответствующих химических превращениях. Не правда ли, такой подход напоминает периодическую систему химических элементов Д.И. Менделеева? И так же, как и менделеевская система, данная карта обладает прогностической силой. С ее помощью был предсказан целый ряд новых ферментов, которые впоследствии были обнаружены экспериментально.

Подобные схемы могут быть распространены и на другие метаболические процессы (например, углеводов, аминокислот и т.д.), а также использованы для поиска новых метаболитов биохимических реакций.

Таким образом, функциональная протеомика занимается изучением сложных взаимосвязей структуры и функций протеома.

Практическая протеомика

Рис. 18. Взаимосвязь геномики, протеомики и биоинформатики при решении проблемы конструирования новых лекарственных средств

Список литературы

1. Sanger F., Air G.M., Barrell B.G., Brown N.L. et al. Nucliotide sequence of bacteriophage phi X-174 DNA.//Nature. 1977. V. 265, № 5596. P. 687–695.

2. Fleischmann R.D., Adams M.D., White O. et al. Whole-genome random sequencing and assembly of Haemophilus influenzae Rd.//Science. 1995. V. 269, № 5223. P. 496–512.

3. Nature. 2001. 409, № 6822 (большая часть выпуска журнала посвящена расшифровке генома человека).

4. Ferguson-Smith A.C., Ruddle F.H. The genomics of human homeobox-containing loci.//Pathol. Immunopathol. Res. 1988. V. 7, № 1–2. P. 119–126.

5. Franklin J. Bioinformatics changing the face of information.//Ann. NY Acad. Sci. 1993. V. 700. P. 145–152.

6. Wasinger V.C., Cordwell S.J., Cerpa-Poljak A. et al. Progress with gene-product mapping of the Mollicutes: Mycoplasma genitalium.//Electrophoresis. 1995. V. 16, № 7. P. 1090–1094.

7. Замятнин А.А. Блистающий мир белков и пептидов.//Биология. 2002. № 25–26. P. 8–13.

8. Gorg A., Weiss W., Dunn M.J. Current two-dimensional electrophoresis technology for proteomics.//Proteomics. 2004. V. 4, № 12. P. 3665–3685.

9. Ramstrom M., Bergquist J. Miniaturized proteomics and peptidomics using capillary liquid separation and high resolution mass spectrometry.//FEBS Lett. 2004. V. 567, № 1. P. 92–95.

10. http://au.expasy.org/sprot/

11. http://erop.inbi.ras.ru/

Оценки течения различных физиологических процессов (беременность, развитие иммунной системы) и обнаружения осложнений в их течении (патология беременности).