Юрий Александрович Васильев

Подготовка набора данных для обучения и тестирования программного обеспечения на основе технологии искусственного интеллекта. Учебное пособие


Скачать книгу

тестирования и т.п.).

      Также разметка характеризуется следующими параметрами:

      1. Уровень разметки: пациент, серия, набор изображений, изображение.

      Примеры:

      – на уровне пациента: у пациентки с диагнозом злокачественного новообразования (ЗНО) молочной железы разметка проводится на основании маммографии и гистологического исследования;

      – на уровне серии (у той же пациентки): маммография, прямая и боковая проекции;

      – на уровне изображения: прямая проекция правой молочной железы.

      2. Тип разметки: бинарная, мультикласс, мультилейбл.

      Примеры:

      – бинарная разметка: норма/патология;

      – мультиклассовая разметка: норма/патология/технический дефект;

      – мультилейбл разметка: лейбл «Признаки эмфиземы легкого», лейбл «Процент поражения легкого».

      3. Характер разметки: бинарная, категориальная, регрессионная.

      Примеры:

      – бинарная: наличие признаков патологии/отсутствие признаков патологии;

      – категориальная: категория BI-RADS для маммографии;

      – регрессионная: процент поражения легкого при COVID-19.

      Контрольные вопросы

      1. Какие бывают методы верификации данных?

      2. Какие бывают виды разметки данных по диагностической ценности?

      3. Как классифицируется разметка данных в зависимости от времени получения данных?

      4. Перечислите параметры разметки.

      5. Какие бывают уровни разметки данных? Приведите примеры.

      Глава 2. ЖИЗНЕННЫЙ ЦИКЛ НАБОРОВ МЕДИЦИНСКИХ ДАННЫХ

      Жизненный цикл – развитие системы, продукции, услуги, проекта или другой создаваемой изготовителем сущности – от замысла до вывода из эксплуатации.

      Жизненный цикл данных – последовательность этапов, которую конкретная порция данных проходит от начального этапа создания или получения до момента архивации или удаления [6].

      Жизненный цикл наборов данных состоит из следующих этапов:

      – инициирования;

      – планирования;

      – формирования;

      – этап регистрации и публикации;

      – использования;

      – смены версии;

      – удаления и архивации.

      Последовательность и взаимосвязь этих этапов представлена на рисунке 3.

      Рисунок 3 – Жизненный цикл наборов данных

      Этап инициирования

      Данный этап начинается с момента возникновения потребности или идеи создания НД, поэтому первое, с чем необходимо определиться – это цель их создания. На основании цели создания НД разработана классификация по типам:

      I. Проведение тестирований для оценки функционала (функциональное тестирование) и оценки метрик диагностической точности, настройки ПО на основе ТИИ (калибровочное тестирование) [7].

      II. «Самотестирование техническое» –