Этот обзор исследует современные приложения ИИ в разработке маломолекулярных лекарств с 2019 года. Сначала описывается открытие лекарств с помощью ИИ, включая идентификацию мишеней, планирование синтеза и клинические стадии разработки лекарств. Приложения включают открытие биомаркеров, репозиционирование лекарств и предсказание фармакокинетических свойств.
ИИ преобразовал методы открытия лекарств, значительно повысив эффективность на различных стадиях. Он облегчает идентификацию мишеней, виртуальный скрининг, предсказания ADMET (абсорбция, распределение, метаболизм, экстракция и токсичность) и автоматизацию синтеза. Исследователи используют продвинутые алгоритмы для ускорения открытия новых терапевтических агентов, улучшения точности предсказаний и снижения затрат.
Идентификация мишеней маломолекулярных соединений является критически важным процессом в открытии лекарств. Традиционные методы, такие как аффинный пул-даун и скрининг полного генома, требуют много времени и трудозатрат. ИИ позволяет анализировать большие наборы данных в сложных биологических сетях, идентифицируя молекулярные паттерны, связанные с заболеваниями, и кандидаты на мишени для лекарств.
Недавние исследования используют методы обработки естественного языка, такие как word2vec-эмбеддинги, для повышения чувствительности идентификации мишеней. Технология глубокого обучения графов объединяет графовые структуры с глубоким обучением, эффективно идентифицируя кандидаты на мишени. Недавнее исследование разработало интерпретируемую структуру, используя многоомные сетевые графы для предсказания раковых генов.
Интеграция многоомных данных с научной литературой в графы знаний позволяет ИИ различать отношения между генами и путями заболеваний. Биомедицинские LLM, глубоко интегрированные с биологическими сетями, предоставляют эффективные методы связывания заболеваний, генов и биологических процессов. Платформа PandaOmics признала киназу TRAF2- и NCK-интерактивной как потенциальную мишень для антифибротической терапии, что привело к разработке специфического ингибитора.
Данные из реального мира, такие как медицинские записи и электронные медицинские карты, предоставляют важный контекст для понимания сложных заболеваний. Однако данные из реального мира часто содержат неструктурированный текст и не имеют стандартизации, что ограничивает их применение. Несмотря на эти проблемы, недавние исследования показали, что шумные данные из реального мира могут обучать эффективные модели для открытия генов.
Виртуальный скрининг имеет решающее значение для идентификации потенциальных кандидатов на лекарства. Модели докинга рецептор-лиганд на основе ИИ могут предсказывать трансформации лиганда и генерировать атомные координаты. Недавние достижения в сетях ко-складывания рецептор-лиганд показывают многообещающие результаты в предсказании сложных структур непосредственно из информации о последовательности.
В отсутствие целевых структур можно использовать методы ИИ в предсказательных методах на основе последовательностей, хотя они часто сталкиваются с трудностями в захвате сложности взаимодействий белок-лиганд. Виртуальный скрининг на основе фенотипа жизненно важен для заболеваний, не имеющих определенных мишеней.
Текущие модели сосредоточены на конкретных задачах, что подчеркивает необходимость разработки универсальных моделей, способных справляться с несколькими задачами. Активное обучение и байесовская оптимизация являются эффективными методами для повышения эффективности виртуального скрининга. Интеграция квантовой механики с ИИ предлагает новые инструменты для исследования химического пространства.
Дизайн новых лекарств, осуществляемый с помощью ИИ, автономно создает новые химические структуры, которые соответствуют желаемым молекулярным характеристикам. Традиционные методы зависят от экспертов-дизайнеров. ИИ автоматизировал идентификацию новых структур, что привело к более эффективной эпохе открытия лекарств.
Предсказания ADMET имеют критическое значение для определения эффективности и безопасности лекарств. Хотя для одобрения на рынке требуются лабораторные оценки и их нельзя полностью заменить симуляциями, предсказания ADMET на ранних стадиях могут помочь снизить количество неудач из-за плохих характеристик. ИИ стал ценным инструментом для предсказания свойств ADMET с использованием предопределенных характеристик.
Представление молекул критически важно для производительности ИИ. Высокоразмерные представления, как правило, предоставляют более богатую информацию, чем низкоразмерные. Однако недавние исследования показывают, что интеграция нескольких уровней молекулярного представления может значительно улучшить обучение, что свидетельствует о том, что многомодальные модели ADMET, использующие несколько представлений одновременно, имеют потенциал.
Интерпретируемость остается основной проблемой. Понимание параметров модели в предсказаниях ADMET помогает раскрыть отношения между молекулярными подструктурами и свойствами. Механизмы внимания могут улучшить интерпретируемость, выделяя ключевые атомы или группы. Интеграция химических знаний может дополнительно повысить интерпретируемость, но расширение моделей для достижения комплексного химического понимания остается сложной задачей.
Химический синтез, являющийся одним из узких мест в открытии маломолекулярных лекарств, представляет собой высокотехническую и крайне трудоемкую задачу. Компьютерное планирование синтеза (CASP) и автоматический синтез органических соединений могут помочь облегчить бремя повторяющихся трудоемких задач для химиков, позволяя им заниматься более инновационными работами.
После планирования и синтеза новых фармацевтических соединений технологии ИИ облегчают in vivo валидацию механизма действия (MOA) новых препаратов. В высокопроизводительном скрининге, контролируя изменения в реальном времени в омных данных, технологии ИИ обобщают эти характеристики и разрабатывают модель, способную расшифровывать молекулярные и клеточные механизмы действия нового соединения и его связанные фармакокинетические, фармакодинамические, токсикологические и биодоступные свойства.