Группа Биоинформатики
Приоритеты
- Анализ (сравнение) изображений двумерных гелей
- Интерпретация пептидных фингерпринтов смеси белков
- Создание интегрированной среды данных протеомных поектов
- Методы текстомного анализа
- Oриентированные на подсемейства белковые базы данных
- Параллельные вычисления на кластерах Linux
- Высокопродуктивное трехмерное моделирование белков
- Поиск в геномах лекарственных мишеней
Методы
- Нейросети, в частности упругие карты
- Иерархическая класстеризация, класстеризация k-средних
- Байесовский классификатор
- Редуцирование размерности данных: анализ принципиальных компонентов, многомерное шкалирование
- Rosetta stone метод
Завершенные проекты
- DD-Lab - Web сервис для построения дифференциальных дисплеев изображений двумерных белковых гелей
- CPD – база данных цитохромов P450
- GenMesh – программа для поиска по геномным базам предполагаемых лекарственных мишеней
Новые проекты
- MSA: Программное обеспечение для идентификации белков в смесях на основе анализа их масс-спектрометрического пептидного фингерпринта. MALDI спектры трипсинового перевара фрагментов с SDS-PAGE геля обрабатываются несколькими наиболее популярными алгоритмами и искусственным интеллектом.
- COVAG: Алгоритм для выявления ковариаций в изображениях двумерных гелей. Набор невыравненных изображений приводятся к единой системе координат посредством применения упругих карт. Ковариации ячеек полученных карт проецируется в трехмерное пространство методом многомерного шкалирования. Таким образом ковариирующие на изображении гелей белковые точки проецируются в идентичные места пространства.
- SOTA – Self-Organizing Texts, система обработки и анализа текстов на базе упругих карт. В основе системы лежит выявленияе закономерностей в анотациях статей и сортитрования их в необходим, тематически связанном порядке.
- CPD: Анализ литературных данных для инвентаризации лигандов цитохрома P450. Основанный на теореме Байеса счет используется для доступа к релевантным абстрактам сайта PubMed тематически связанных с цитохромами P450. Используя предварительно сконструированные разговорные шаблоны и контрольные словари данные (субстраты, индукторы, и ингибиторы) записываются в соответствующие поля базы данных.
- Высокопродуктивное моделирование трехмерных структур цитохромов P450. Используя программное обеспечение 6V2 было смоделировано 1200 цитохромов P450 на кластере Linux. Каждой модели соответствует ProCheck отчет о ее качестве, которые сохранены в базе данных цитохромов P450.
- LPPC Local Proteomic Project Conveye – интегрированная среда для документирования и хранения данных протеомноых проектов. Данное направление развивается совместно с фирмой Brucker Daltoniks Gmbh в качестве создания дополнительного модуля для программы ProteinScape. Примерные возможности модуля: (1) ковариационный анализ двумерных гелей (COVAG) and (2) поточная обработка текстомных данных протеомных проектов (SOTA).
- Параллельное множественное выравнивание. Использованы возможности 16 двухпроцессорных узлов Linux кластера для крупномасштабного множественного выравнивания аминокислотных последовательностей белков.
- UM: SNPist Универсальная модель для поиска данных в базе данных SNP. Особое внимание уделено установлению корреляций SNP/патология.
- SDS-PAGE ZOOMER - Компьютерная программа которая на основе анализа принципиальных компонентов позволяет выделяеть спектры индивидуальных белков из массива масс-спектрометрических данных, полученных при сканировании SDS-PAGE геля.
