Статьи с темой: «набор данных»
-
2025 № 7 Автоматизированная платформа для формирования наборов данных в лучевой диагностике.
Актуальность. Количество программного обеспечения с использованием искусственного интеллекта (ПО с ИИ), применяемого в лучевой диагностике, в последние годы стремительно увеличивается. Этот тренд предъявляет высокие требования к качеству и репрезентативности наборов данных, необходимых для обучения, тестирования и мониторинга ПО с ИИ. Однако существующие методы формирования наборов данных зачастую являются трудоемкими и ресурсозатратными, что приводит к замедлению процесса разработки и внедрения новых ИИ-решений, а также к возможным ошибкам при их работе.
Автоматизация процесса формирования наборов данных становится критически важной для преодоления этих ограничений.
Предмет. Методология формирования наборов данных.
Цель: разработка автоматизированной платформы для формирования наборов данных в лучевой диагностике.
Методы. В ходе разработки платформы применялись языки программирования JavaScript, Python и Typescript. В платформе используются локальная база данных Postgres с текстовой информацией об исследованиях, PACS-системы, а также РИС – база данных неразмеченных исследований. Для подтверждения работоспособности платформы проведена ее апробация.
Результаты. Разработана комплексная платформа с локальными постоянными и временными файловыми хранилищами, при помощи которой пользователи могут осуществлять поиск, анонимизацию, выгрузку и разметку исследований, а также последующее формирование результирующих и аннотирующих файлов. В процессе апробации была подтверждена работоспособность платформы, и не было выявлено серьезных технических проблем.
Выводы. Настоящая платформа обеспечивает полный цикл работы пользователя с наборами данных в области лучевой диагностики. Платформа в настоящее время успешно функционирует в государственном бюджетном учреждении здравоохранения города Москвы «Научно-практический клинический центр диагностики и телемедицинских технологий Департамента здравоохранения города Москвы», что позволяет рекомендовать предложенную платформу для использования в практических задачах. -
2023 № 4 Основополагающие принципы стандартизации и систематизации информации о наборах данных для машинного обучения в медицинской диагностике
О б о с н о в а н и е : Активное внедрение технологий искусственного интеллекта в сферу здравоохранения, которое мы наблюдаем в последние годы, способствует резкому росту количества медицинских данных, собираемых для разработки моделей машинного обучения, в том числе данных лучевой и инструментальной диагностики. Для решения различных задач в области цифровых медицинских технологий посредством алгоритмов машинного обучения создаются все новые и новые наборы данных, поэтому становятся актуальными проблемы их систематизации и стандартизации, хранения, доступа, рационального
и безопасного использования.
Ц е л ь : разработка подхода к систематизации и стандартизации информации о наборах данных для решения вопросов представления, хранения, применения и оптимизации использования наборов данных и обеспечения безопасности и прозрачности процессов разработки и испытаний медицинских изделий с использованием искусственного интеллекта.
М е т о д ы : анализ собственного и мирового опыта по созданию и использованию медицинских наборов данных, поиск и анализ медицинских справочников, разработка и обоснование структуры реестра, поиск научных публикаций с ключевыми словами «наборы данных», «реестр медицинских данных», размещенных в реферативных базах данных РИНЦ, Scopus, Web of Science.
Р е з у л ь т а т ы . Разработана структура реестра наборов данных в медицинской инструментальной диагностике с разделами, отражающими информацию по всем этапам формирования и использования наборов данных для машинного обучения: 7 параметров на этапе инициирования, 8 – на этапе планирования, 70 – карточка набора данных, 1 – смена версии, 14 – на этапе использования, всего – 100 параметров. В работе предлагается классификация наборов данных по цели их создания, классификация методов верификации данных, а также принципы формирования названий для стандартизации и наглядности представления наборов данных. Кроме того, освещены основные особенности организации ведения данного реестра: управление, качество данных, конфиденциальность и безопасность.
В ы в о д ы . Впервые предлагается оригинальная технология структуризации и систематизации управления медицинскими наборами данных для инструментальной диагностики, в основу которой положены разработанная терминология и принципы классификации информации, что позволяет стандартизировать структуру информации о наборах данных для машинного обучения, обеспечивает централизацию хранения, удобный и быстрый доступ ко всей информации о наборе данных, а также прозрачность, надежность и воспроизводимость результатов в сфере искусственного интеллекта. Создание реестра дает возможность оперативно формировать наглядные библиотеки данных, позволяя обширному кругу исследователей, разработчиков и компаний выбирать наборы данных для своих задач, что обеспечивает их широкое использование, оптимизацию ресурсов и способствует быстрому развитию и внедрению искусственного интеллекта.