С ростом популярности секвенаторов ДНК было предпринято множество проектов по геному , и у различных организмов были секвенированы и аннотированы их геномы . Многие геномы в виде их аминокислотных или нуклеотидных последовательностей доступны в нескольких общедоступных базах данных, а GenBank, EMBL и DDBJ являются крупнейшими хранилищами такой информации. В отличие от небольшого количества трехмерных структур, количество последовательностей в общедоступных базах данных чрезвычайно велико, что благоприятствует научному сообществу, которое использует эти последовательности в своих исследованиях, включая прогнозирование взаимодействия.
Прогнозирование взаимодействия на основе множественного выравнивания последовательностей (MSA)
Класс метода использует множественное выравнивание последовательностей (MSA) для прогнозирования межбелкового взаимодействия.и каждый из них основан на биологической предпосылке, которая обычно направлена на определение сохранности последовательностей организмов с использованием программного обеспечения для выравнивания. Они есть:
Прогнозирование на основе филогенетического профиля (совместная встречаемость): метод основан на биологической предпосылке, что если два гена остаются консервативными при сравнении нескольких организмов, соответствующий белок, транслируемый этими генами, будет взаимодействовать. Это предположение становится еще сильнее, когда оба консервативных генане присутствуют в одном или нескольких сравниваемых организмах, демонстрируя селективное давление в отношении того, что оба они остаются или удаляются вместе из генома.
Неопределенность при использовании этого метода состоит в том, чтобы определить, насколько филогенетически далекие должны быть сравниваемые организмы, поэтому выбор близких организмов затрудняет определение того, сохраняются ли белки, потому что они находятся под эволюционным давлением, или просто потому, что не было достаточно времени для расхождения. Чем дальше находятся организмы, тем надежнее будет прогноз, но будет выявлено меньше взаимодействий.