Фото с Яндекса.
Специалистами ФГБУ «ЦСП» ФМБА России разработан новейший способ определения in silico аффинности низкомолекулярного лиганда к белку с помощью модели аффинности DrugForm-DTA, обученной на базе данных BindingDB. Данный инструмент позволяет быстро и точно оценивать сродство лиганда к целевому белку без учета трехмерной структуры. Получен патент на изобретение № 2858206 от 13 марта 2026 г.
В области современной разработки лекарств (драг-дизайна) всё большее значение приобретает способность быстро обрабатывать огромные массивы данных о взаимодействии молекул с белками-мишенями. Компьютерные методы, основанные на машинном обучении и нейросетях, становятся основой для создания конвейера разработки лекарств, где ключевым этапом является точное прогнозирование аффинности (сродства) малой молекулы к целевому белку. В решении данной задачи существенных успехов позволило добиться применение нейросетевых подходов с использованием обработки естественного языка (NLP).
Разработанный специалистами ФГБУ «ЦСП» ФМБА России способ определения in silico аффинности низкомолекулярного лиганда к белку с помощью модели аффинности DrugForm-DTA, обученной на базе данных BindingDB, рассчитывает значения констант аффинности (pKi, pIC50), получая в качестве входных данных аминокислотную последовательность белка и/или химическую формулу лиганда в формате SMILES-строки.
Ключевые особенности модели:
- Высокая производительность и точность прогнозов – разработанная модель обеспечивает надежные результаты для широкого спектра задач.
- Набор данных для обучения сформирован путем тщательного анализа и фильтрации с приоритетом сохранения наибольшего количества валидных данных. В выборку также включены белки, содержащие мутации, что расширяет возможности практического применения модели.
- При обучении применялась оригинальная комбинация разбиений на обучающий и тестовый наборы данных, что позволило провести качественное тестирование модели и избежать переобучения модели.
- Не требует трехмерной структуры – модель использует языковые модели для обработки входных данных в виде аминокислотной последовательности белка и SMILES-строки лиганда, что значительно упрощает и ускоряет вычисления.
Представленный способ определения in silico аффинности может использоваться для решения практических задач в области драг-дизайна. Модель обучена на основе одной из крупнейших баз данных значений аффинности BindingDB и может быть применена для поиска активных низкомолекулярных соединений к широкому спектру белков – как человека, так и других млекопитающих.
Прогнозирование аффинности лиганда к белку применяется в практической и теоретической биологии, медицине, химии и фармацевтике для скрининга активных соединений – быстрого отбора перспективных молекул из больших библиотек, а также для оценки нецелевых эффектов (расчета возможных побочных взаимодействий разрабатываемых биоактивных лигандов на ранних этапах).