Источник: [Machine Learning-enabled Medical Devices…, 2021].
Существует много алгоритмов машинного обучения, отличающихся возможностями и ограничениями. К принципиальным характеристикам, присущим тому или иному алгоритму ИИ, можно отнести [Глизница и др., 2022]:
1. Интерпретируемость – возможность установить основания принятого алгоритмом решения, открыть «черный ящик». Возможность объяснить решение, предлагаемое алгоритмом, значительно облегчает внедрение методов в медицинскую практику.
2. Устойчивость к мультиколлинеарности – корреляционной связи между независимыми переменными, которая негативно сказывается на времени обучения и точности результата. В частности, учет избыточного числа переменных из медицинской карты приводит к формированию слишком сложной модели с несущественными признаками заболевания (эффект переобучения), не способной к обобщению.
3. Возможность выбора переменных, позволяющая снизить эффект мультиколлинеарности. Например, если алгоритм учел в построенной математической модели и национальность, и расовую принадлежность пациента, то возможность вручную исключить один из параметров, не редактируя набор данных, значительно облегчит работу с системой.
К основным подходам машинного обучения можно отнести следующие:
– контролируемое машинное обучение (обучение с учителем, supervised machine learning), когда алгоритм ИИ наблюдает набор размеченных данных и обучается функции, позволяющей предсказывать аннотацию для новых входных данных;
– неконтролируемое машинное обучение (обучение без учителя, unsupervised machine learning), когда алгоритм распознает паттерны (структуру) в неразмеченных данных, выявляя скрытые закономерности.
Под разметкой данных (data labeling) понимается этап обработки структурированных и неструктурированных данных, в процессе которого данным (в том числе текстовым документам, фото- и видеоизображениям) присваиваются идентификаторы, отражающие их тип (классификация), и (или) осуществляется интерпретация данных для решения конкретной задачи.
Такие популярные алгоритмы глубокого обучения, как сверточные нейронные сети, глубокие сети доверия, рекуррентные нейронные сети и другие, лежат в основе услуг многих технологических гигантов.
В настоящее время перспективным направлением является построение алгоритмов ИИ на основе наиболее биологически достоверных моделей (выполнение нейроморфных вычислений, максимально приближенных к работе человеческого мозга). Спайковая нейронная сеть (spiking neural network, SNN) является одним из основных «кандидатов» для преодоления ограничений нейронных вычислений и эффективного использования алгоритма машинного обучения в реальных приложениях. Концепция вдохновлена механизмами взаимодействия между нейронами, основанными на передаче информации при помощи электрических импульсов, дискретных пространственно-временных сигналов (спайков). Спайковые нейронные сети построены на основе биологических методов обработки информации, где разреженные во времени асинхронные сигналы передаются и обрабатываются массово-параллельным образом. Они демонстрируют