Фрагмент для ознакомления
2
BIG DATA В КЛИНИЧЕСКОЙ ЛАБОРАТОРНОЙ ДИАГНОСТИКЕ
Введение
Термин “большие данные – big data” относится к данным, которые настолько велики, быстры и сложны, что их трудно или невозможно обработать традиционными методами. Доступ и хранение больших объемов информации для аналитики существует уже давно. Но концепция больших данных набрала обороты в начале 2000-х годов, когда отраслевой аналитик Дуг Лейни (Doug Laney) сформулировал ныне распространенное определение больших данных как три V: volume, velocity, variety.
Объем (volume). Сбор данных происходит из различных источников, включая как интеллектуальные устройства (ИУ), используемые человеком, так и компьютерное оборудование медицинских учреждений, и промышленное оборудование современных предприятий. К ИУ относятся айфоны, смартфоны, электронные часы, браслеты и другие гаджеты, снабженные датчиками [1].
В прошлом хранение информации было бы проблемой, но с появлением инновационных платформ задача упростилась, оно стало более доступным и дешевым. В 2015 году Apple и IBM консолидировали свою работу в создании big data в области медицины. Они создали единую платформу Watson Health, где собираются и анализируются сведения, поступившие с “умных” устройств.
ОСНОВНАЯ ЧАСТЬ
2.1. Значение больших баз данных в современной медицине
В научной зарубежной и отечественной литературе термин “Big Data” трактуется по-разному. В зарубежной – это, прежде всего, огромный объем накопленной информации. В российской – это, в первую очередь, инновационные технологии для анализа и обработки информации, которые являются альтернативными и усовершенствованными системами и методами. Информационные каналы информации подразделяются на диджитальные (датчики) и софтверные (программные).
В 60-х годах 20 века медицинская отрасль стала первой в обращении к информационным технологиям (ИТ). Огромное количество информации, которая в большинстве своем была написана на бумаге, нуждалось в обработке, систематизации и хранении. [4]. В настоящее время большая база данных значительно пополнилась, так как медицина очень быстро переходит на цифровой формат. По статистике около 30 % всей мировой информации относится к области медицины. Большая часть информации продолжает храниться на бумажных носителях. Но стремительная оцифровка этих данных продолжает пополнять эту долю [5, 6].
Таким образом, медицинские базы данных последовательно наполняются огромной цифровой разнородной неструктурированной, полуструктурированной и структурированной медицинской информацией. Чтобы управлять ею недостаточно использования традиционных инструментов и привычного программного обеспечения.
Возможность использования Big Data в здравоохранении с помощью цифровой медицины стала неоценимой для медицинских организаций, работающих в условиях новых реальностей. Наличие доступа к данным через цифровую медицину дает больше возможностей для своевременного активного вмешательства и более точного представления о здоровье пациентов с помощью консолидированной информации в режиме реального времени [7].
Хочется подчеркнуть, что за период пандемии многие люди откладывали посещение врача. Использование цифровых медицинских платформ с большими данными и интеллектуальными устройствами смогут обеспечивать клиницистам доступ ко всему объему медицинской информации о пациенте, одновременно снижая потребность в личных визитах и улучшая результаты лечения.
Использование цифровых медицинских платформ будет гораздо более комфортным и персонализированным для многих людей. Даст им более свободный и частый доступ к врачам. Базы данных жизненно важны для будущей совместной работы пациентов и медицинских работников. Платформы цифровой медицины могут помочь сократить количество ненужных визитов пациентов к врачу или в больницу.
Одним из важных достижений технологии Big data стало создание электронной медицинской карты (ЭМК). Электронные медицинские записи (Electronic Health Records, EHR за рубежом) обладают детализацией полных данных на уровне пациента для решения сложных исследовательских вопросов, которые невозможно реализовать с помощью традиционных записей выписки или баз данных регистратур.
Использование ЭМК строится на объединении данных в единую среду на базе ВЭБ. В нее поступает информация из различных источников. Это могут быть диджитальные источники, определяющие состояние человека или информация о результатах лабораторных исследований, пройденном лечении и т.д. При помощи данной технологии может осуществляться контроль и наблюдение за больным. Программа может предупредить о предстоящем посещении к врачу или об очередном приеме лекарства. Все данные в электронной карте строго систематизированы, упорядочены, надежно защищены и профессиональны.
Инициированная Джорджем Бушем младшим в 2004 году, ЭМК нашла широкое применение в США. В ЕС процесс цифровизации, модернизации и централизации электронных медицинских карт успешно продвигается. Делается попытка создания в западном пространстве единой EHR для стран Евросоюза и Америки. В России данная технология находится на стадии своего становления [8].
Для медицинской электронной карты принят золотой стандарт эффективности. Он опирается на три составляющие: рандомизированные применением контролируемые исследования (РКИ – тип научного исследования со случайным делением на группы, с контрольной группой и группой плацебо), клинические исследования с использованием больших данных с использованием электронных медицинских записей (EHR) и лабораторную диагностику, цель которой постановка точного диагноза или стратификация риска.
2.2. BIG DATA в клинической лабораторной диагностике
Весной 2019 года в Испании проходил 23-й Европейский конгресс в области клинической химии и лабораторной медицины. В нем принимали участие около 6 тысяч ученых из более 80 стран мира. Основным направлением в обсуждениях профессионалов было рассмотрение изменения роли медицинских лабораторных исследований в быстроменяющихся принципах и подходах современной медицины. Ученые обсуждали целый ряд вопросов:
- связь клинической лабораторной медицины с интеграцией больших баз информации
- роль искусственного интеллекта в медицине и лабораторной диагностики
- новые проблемы, связанные с этикой и безопасностью использования инновационных технологий и электронных баз данных в современной медицине
Ряд докладов на конференции вызывал большой интерес в концепте “ Big data – клиническая лабораторная диагностика ”. Но все они сводились к очень осторожному подходу в рассмотрении этой парадигмы. Вопрос качества использования Big data в клинической лабораторной диагностике до сих пор остается открытым.
Директор Health Data Research (Великобритания) и заместитель директора Эдинбургского университета Эндрю Моррис подчеркнул огромные риски в использовании киберфизических систем, интеллектуального анализа и других высокотехнологичных инструментов.
Дамьен Грусон, руководитель отделения медицинской биохимии в больнице Университета Лувена (Брюссель, Бельгия), Эмерсон Гаспаретто, главный врач DASA, крупнейшей бразильской компании в области лабораторной диагностики, Елена Кондрашева, руководитель Технологического департамента ИНВИТРО сошлись во мнении, что современная лаборатория является неоценимым кладезем Big Data. Вопрос заключается в том, как его профессионально и грамотно использовать. Если бессистемно пропускать весь накопленный материал через электронные сети, вряд ли получится значимый результат. На помощь приходит человеческий фактор: хорошо обученные профессионалы, умеющие обращаться с компьютерными программами, владеющие не только медицинскими навыками, но и знаниями определенных алгоритмов и компьютерных программ, умеющие управлять искусственным интеллектом. Иными словами естественный интеллект должен придти на помощь искусственному интеллекту [19]. Одним из таких “содружеств” является машинное обучение.
Машинное обучение - это научная дисциплина, которая фокусируется на том, как компьютеры учатся на данных. Она возникает на стыке статистики, которая стремится изучать взаимосвязи информации и информатики с ее акцентом на эффективные вычислительные алгоритмы. Этот союз между математикой и информатикой обусловлен уникальными вычислительными задачами построения статистических моделей из массивных наборов данных, которые могут включать миллиарды или триллионы точек данных. Типы обучения, используемые компьютерами, удобно подразделяются на такие категории, как контролируемое обучение и неконтролируемое обучение. Еще одно разделение может быть полезно при рассмотрении того, как машинное обучение может информировать практику медицины: обучения тем задачам, которые врачи уже могут выполнять хорошо, и обучения тем, где врачи имели лишь ограниченный успех [20]. Машинное обучение претерпело значительное развитие за последнее десятилетие и успешно используется во многих интеллектуальных приложениях, охватывающих широкий спектр проблем, связанных с данными. Один из самых интригующих вопросов заключается в том, можно ли успешно применить машинное обучение в области медицинской лабораторной диагностики. Кроме того, возникает вопрос, какие именно данные необходимы. Попробуем на него ответить.
Одним из видов машинного обучения является Supervised Learning (обучение с учителем). Интересно заметить, что компьютер учиться по отобранным человеком данным. Машинное контролируемое обучение – новая концепция, которая стала мейнстримом в современной медицине. Смысл такого обучение заключается в том, что компьютер создает алгоритмы из шаблонов, которые строятся на введенной человеком информации, а не стандартно программируется. Далее машина делает прогнозы [20].
Чем точнее набор вводимых данных, тем правильнее выходные данные, которые позволяют модели учиться с течением времени. Алгоритм измеряет свою точность через функцию потерь, корректируя ее до тех пор, пока ошибка не будет достаточно минимизирована [21].
Контролируемое обучение фокусируется на классификации, которая включает в себя выбор между подгруппами, чтобы наилучшим образом описать новый экземпляр данных, и прогнозирование, которое включает в себя оценку неизвестного параметра [22].
Наиболее распространенным примером в клинической диагностике является автоматизированная интерпретация ЭКГ. Распознавание образов выполняется для выбора из ограниченного набора диагнозов. В радиологии автоматическое обнаружение легочного узелка на рентгенограмме грудной клетки также представляет собой контролируемое обучение. В обоих этих случаях компьютер с высокой точностью приближается к тому, на что уже способен опытный врач.
Показать больше
Фрагмент для ознакомления
3
ЛИТЕРАТУРА
1. Antropova M. Y., Vlasov A.A., Kasyanenko E.F. Mobile technologies in educational process chinese universities // New Trends and Issues Proceedings on Humanities and Social Sciences. — 2019. — no. 6(5). — P. 001–007. DOI: 10.18844/procos.v6i5.4367
2. Wayne Thompson. Big data. What it is and why it matters // SAS Available at: https://www.sas.com/en_us/insights/big-data/what-is-big-data.html [Accessed 5 April, 2021]
3. Jennifer Haas. How Big Data will accelerate the future of digital medicine in 2021 // Parmaphorum. 2021 Available at: https://pharmaphorum.com/views-analysis-digital/the-future-of-digital-medicine-in-2021/ [Accessed 5 April, 2021]
4. Карнаухов Н.С, Ильюхин Р.Г. Возможности технологий "Big Data" в медицине. Врачи и информационные технологии. 2019. N1. С. 59 – 63
5. Тушенцова К.В. Современные аналитические технологии в медицине. Теория и практика современной науки. - 2016. - № 5(11). - С. 955-957.
6. Lederman R, Dreyfus S. Managing Health Information Delivery Processes for Better Medical Decision Making. Frontiers in artificial intelligence and applications. - 2014. - Jun. - С. 329-340
7. Макарова Е.П., Розенцвит С.К., Буллих А.В. Перспективные инновационные направления в сфере здравоохранения в России. Научная дискуссия: инновации в современном мире. - 2016. -№ 6-1 (49). - С. 67-73
8. Ижунинов М.А. Big Data в здравоохранении. Молодой ученый. 2019. N 50 (288). C. 8 – 10 [Электронный ресурс]. URL: https://moluch.ru/archive/288/65036/ (дата обращения 05. 04. 2021)
9. Касьяненко Е.Ф., Рубцова Л.Н., Димов И.Д., Богомолова В.Ю. Дистанционное и мобильное обучение в медицинских вузах: проблемы и перспективы // Современные проблемы науки и образования. 2019. N 5. DOI 10.17513/spno.29216
10. Лаванов С. Как геймификация меняет систему здравоохранения // Rusbase. 2018 [Электронный ресурс]. URL: https://rb.ru/opinion/gejmifikaciya-menyaet-sistemu/ (дата обращения 05. 04. 2021)
11. Телемедицинская сеть, в которой зарегистрировано 100 тысяч врачей // EverCare. 2016 [Электронный ресурс]. URL: https://evercare.ru/healthtap-results (дата обращения 05. 04. 2021)
12. Диагностика и анализы через Интернет для всех. В США // EverCare. 2016 [Электронный ресурс]. URL: https://evercare.ru/HealthTap (дата обращения 05. 04. 2021)
13. Рынок телемедицины в России: перспективы развития цифровой медицины // Delovoy profil. 2021 [Электронный ресурс]. URL: https://delprof.ru/press-center/open-analytics/rynok-telemeditsiny-v-rossii-perspektivy-razvitiya-tsifrovoy-meditsiny/ (дата обращения 05. 04. 2021)
14. План мероприятий («дорожная карта») «Хелснет» Национальной технологической инициативы. 2016 [Электронный ресурс]. URL: https://nti2035.ru/markets/docs/DK_healthnet.pdf (дата обращения 06. 04. 2021)
15. Лисица А.В., Пономаренко Е.А., Лохов П.Г., Арчаков А.И. Постгеномная медицина: альтернатива биомаркерам. Вестник Российской академии медицинских наук. - 2016. - № 3. - С. 255-260
16. Искусственный интеллект меняет бизнес фармкомпаний // Фармацевтический вестник: электронный научный журнал. 22.11.2017 [Электронный ресурс]. URL: https://pharmvestnik.ru/content/articles/iskusstvennyj-intellekt-menjaet-biznes-farmkompanij.html (дата обращения 06. 04. 2021)
17. Большие данные (Big Data) в России. 2021 [Электронный ресурс]. URL: https://www.tadviser.ru/index.php/ (дата обращения 06. 04. 2021)
18. От идеи до пациента // RGRU Digital. 2020 [Электронный ресурс]. URL: https://rg.ru/2020/12/06/cifrovizaciia-otkryvaet-novye-vozmozhnosti-v-diagnostike-i-lechenii.html (дата обращения 06. 04. 2021)
19. Создаем меняющие жизнь технологии [Электронный ресурс]. URL: // www.invitro.ru/upload/iblock/814/8145fa4ddd37326cca9c187adeb343d4.pdf/ (дата обращения 06. 04. 2021)
20. Rahul C. Deo. Machine Learning in Medicine. Circulation. 2015 Nov 17; 132(20): 1920–1930. doi: 10.1161/CIRCULATIONAHA.115.001593
21. Введение в машинное обучение // Хабр. 2018. [Электронный ресурс]. URL: https://neurohive.io/ru/osnovy-data-science/vvedenie-v-mashinnoe-obuchenie-kto-ego-primenjaet-i-kak-stat-razrabotchikom/ (дата обращения 06. 04. 2021)
22. Supervised Learning // IBM/ 2020 Available at: https://www.ibm.com/cloud/learn/supervised-learning [Accessed 5 April, 2021]
23. Lip GYH, Nieuwlaat R, Pisters R, Lane DA, Crijns HJGM. Refining clinical risk stratification for predicting stroke and thromboembolism in atrial fibrillation using a novel risk factor-based approach: the euro heart survey on atrial fibrillation. Chest. 2010;137:263–272
24. Gunčar, G., Kukar, M., Notar, M. et al. An application of machine learning to haematological diagnosis. Sci Rep 8, 411 (2018). https://doi.org/10.1038/s41598-017-18564-8
25. Woodruff PG, Modrek B, Choy DF, Jia G, Abbas AR, Ellwanger A, Koth LL, Arron JR, Fahy JV. T-helper type 2-driven inflammation defines major subphenotypes of asthma. Am J Respir Crit Care Med. 2009;180:388–395
26. Elizabeth McPherson. Genetic Diagnosis and Testing in Clinical Practice. Clin Med Res. 2006 Jun; 4(2): 123–129. doi: 10.3121/cmr.4.2.123
27. Ильясова Н.Ю., Куприянов А.В., Попов С.Б., Парингер Р.А. Особенности использования технологий Big Data в задачах медицинской диагностики. Системы высокой доступности. - 2016. - 12(1). -С. 45-52
28. Ozgur Cogulu, Jacqueline Schoumans, Gocce Toruner, Urszula Demkow, Emin Karaca, Asude Alpman Durmaz, "Laboratory Genetic Testing in Clinical Practice 2016", BioMed Research International, vol. 2017, Article ID 5798714, 2 pages, 2017. https://doi.org/10.1155/2017/5798714
29. Неинвазивный пренатальный тест // KDL [Электронный ресурс]. URL: https://kdl.ru/patient/blog/neinvazivnyj-prenatalinyj-test-nipt (дата обращения 06. 04. 2021)
30. Point-of-caretesting // Abbot Available at: https://www.pointofcare.abbott/us/en/about-us/benefits-of-point-of-care-testing [Accessed 5 April, 2021]