Группа Биоинформатики

Приоритеты

  • Анализ (сравнение) изображений двумерных гелей
  • Интерпретация пептидных фингерпринтов смеси белков
  • Создание интегрированной среды данных протеомных поектов
  • Методы текстомного анализа
  • Oриентированные на подсемейства белковые базы данных
  • Параллельные вычисления на кластерах Linux
  • Высокопродуктивное трехмерное моделирование белков
  • Поиск в геномах лекарственных мишеней

Методы

  • Нейросети, в частности упругие карты
  • Иерархическая класстеризация, класстеризация k-средних
  • Байесовский классификатор
  • Редуцирование размерности данных: анализ принципиальных компонентов, многомерное шкалирование
  • Rosetta stone метод

Завершенные проекты

Новые проекты

  • MSA: Программное обеспечение для идентификации белков в смесях на основе анализа их масс-спектрометрического пептидного фингерпринта. MALDI спектры трипсинового перевара фрагментов с SDS-PAGE геля обрабатываются несколькими наиболее популярными алгоритмами и искусственным интеллектом.
  • COVAG: Алгоритм для выявления ковариаций в изображениях двумерных гелей. Набор невыравненных изображений приводятся к единой системе координат посредством применения упругих карт. Ковариации ячеек полученных карт проецируется в трехмерное пространство методом многомерного шкалирования. Таким образом ковариирующие на изображении гелей белковые точки проецируются в идентичные места пространства.
  • SOTA – Self-Organizing Texts, система обработки и анализа текстов на базе упругих карт. В основе системы лежит выявленияе закономерностей в анотациях статей и сортитрования их в необходим, тематически связанном порядке.
  • CPD: Анализ литературных данных для инвентаризации лигандов цитохрома P450. Основанный на теореме Байеса счет используется для доступа к релевантным абстрактам сайта PubMed тематически связанных с цитохромами P450. Используя предварительно сконструированные разговорные шаблоны и контрольные словари данные (субстраты, индукторы, и ингибиторы) записываются в соответствующие поля базы данных.
  • Высокопродуктивное моделирование трехмерных структур цитохромов P450. Используя программное обеспечение 6V2 было смоделировано 1200 цитохромов P450 на кластере Linux. Каждой модели соответствует ProCheck отчет о ее качестве, которые сохранены в базе данных цитохромов P450.
  • LPPC Local Proteomic Project Conveye – интегрированная среда для документирования и хранения данных протеомноых проектов. Данное направление развивается совместно с фирмой Brucker Daltoniks Gmbh в качестве создания дополнительного модуля для программы ProteinScape. Примерные возможности модуля: (1) ковариационный анализ двумерных гелей (COVAG) and (2) поточная обработка текстомных данных протеомных проектов (SOTA).
  • Параллельное множественное выравнивание. Использованы возможности 16 двухпроцессорных узлов Linux кластера для крупномасштабного множественного выравнивания аминокислотных последовательностей белков.
  • UM: SNPist Универсальная модель для поиска данных в базе данных SNP. Особое внимание уделено установлению корреляций SNP/патология.
  • SDS-PAGE ZOOMER - Компьютерная программа которая на основе анализа принципиальных компонентов позволяет выделяеть спектры индивидуальных белков из массива масс-спектрометрических данных, полученных при сканировании SDS-PAGE геля.