Фрагмент для ознакомления
2
Введение
Применение методов машинного обучения в последние годы достигло огромного прогресса во многих областях, таких как распознавание образов, обработка языка и робототехника. Одним из конкретных применений этих методов, которое становится все более важным, является анализ временных рядов данных в области интеллектуального анализа данных.
Анализ временных рядов связан с анализом данных, собранных за определенный период времени. Эти данные могут поступать из различных источников, таких как погодные данные, данные финансового рынка, медицинские записи или данные датчиков IoT-устройств. Понимание и интерпретация этих наборов данных может дать ценные сведения и знания.
Применение методов машинного обучения, в частности алгоритмов контролируемого, неконтролируемого и полуконтролируемого обучения, было определено как эффективный метод анализа данных временных рядов. Эти алгоритмы помогают выявлять закономерности, тенденции и корреляции в данных, чтобы делать прогнозы или распознавать проблемы.
Особенность применения методов машинного обучения для анализа временных рядов заключается в сложностях, связанных с этим типом данных. Данные временных рядов характеризуются последовательным характером, поскольку наблюдения происходят в определенном порядке. Эта зависимость от последовательности предъявляет новые требования к разрабатываемым алгоритмам и требует специальной предварительной обработки для преобразования данных в форму, пригодную для машинного обучения.
Кроме того, временные ряды часто характеризуются сложными закономерностями, которые трудно уловить с помощью традиционных статистических методов. Машинное обучение позволяет моделировать и извлекать эти нелинейные взаимосвязи, тем самым поддерживая точность прогнозирования и принятия решений.
Применение методов машинного обучения для анализа временных рядов при интеллектуальном анализе данных открывает далеко идущие возможности и в то же время таит в себе проблемы. Сочетание машинного обучения с технологиями больших данных и современным оборудованием открывает новые области применения, такие как мониторинг в реальном времени в различных отраслях промышленности, оптимизация операционных процессов и разработка персонализированных рекомендательных систем.
В данной работе рассматриваются концепции применения методов машинного обучения для анализа временных рядов в интеллектуальном анализе данных на основе теоретических исследований. В качестве источников были отобраны работы из рецензируемых журналов, результаты вторичных исследований.
Основная часть
1. Определения
Интеллектуальный анализ данных - это процесс обнаружения, обработки и интерпретации информации и закономерностей в больших объемах данных. Он включает в себя извлечение полезной и ранее неизвестной информации, скрытой в данных. Добыча данных направлена на получение ценных сведений и создание лучшей основы для принятия решений. Основной целью интеллектуального анализа данных является поиск корреляций и закономерностей в данных без выдвижения априорных гипотез [1].
Термин "интеллектуальный анализ данных" используется с 1960-х годов и сейчас широко распространен. Этот термин объединяет несколько концепций и инструментов, включая статистику, большие данные и машинное обучение.
Статистика включает классические описательные модели и инструменты, которые позволяют анализировать данные с помощью степеней свободы, F-статистики и p-значений. Однако статистика не занимается выводом гипотез [1].
Большие данные являются общим термином для наборов данных любого размера, но особенно акцентируют внимание на больших объемах данных, так как доступность данных сейчас влияет на все сферы жизни.
В свою очередь, машинное обучение – это инструменты, которые позволяют создавать компьютерные программы для анализа баз данных в поиске шаблонов и закономерностей.
Методы машинного обучения играют важнейшую роль в анализе данных. Они помогают распознавать сложные закономерности и взаимосвязи между точками данных и делать прогнозы. Машинное обучение позволяет учиться на существующих данных, распознавать закономерности и создавать модели, которые могут обобщать эти закономерности.
Статистика и машинное обучение являются технической основой интеллектуального анализа данных. Однако интеллектуальный анализ данных также может включать другие методы, такие как предварительная обработка данных, хранение данных, аналитическая обработка данных в режиме онлайн, кубы данных и т.д.
Интеллектуальный анализ данных также может быть рассмотрен как часть процесса извлечения знаний (knowledge data discovery), который включает не только анализ данных, но и предварительную обработку данных, хранение данных и другие этапы.
Таким образом, интеллектуальный анализ данных – это научная дисциплина, которая сочетает достижения нескольких областей исследований, таких как статистика, большие данные и машинное обучение. Эта дисциплина имеет свою структуру и динамику развития, которые определяют ее место в общей совокупности человеческих знаний и ее вклад в научно-технический прогресс.
В свою очередь, временной ряд - это последовательность точек данных, которые были измерены или наблюдались через регулярные промежутки времени. Каждая точка данных во временном ряду представляет собой определенное свойство или поведение в определенный момент времени. Временные ряды могут содержать различные типы данных, такие как погодные данные, цены на акции, показатели продаж, численность населения или медицинские измерения.
Показать больше
Фрагмент для ознакомления
3
Список использованной литературы
1. Зеленков Юрий Александрович, Анисичкина Екатерина Алексеевна ДИНАМИКА ИССЛЕДОВАНИЙ В ОБЛАСТИ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ: ТЕМАТИЧЕСКИЙ АНАЛИЗ ПУБЛИКАЦИЙ ЗА 20 ЛЕТ // Бизнес-информатика. 2021. №1. URL: https://cyberleninka.ru/article/n/dinamika-issledovaniy-v-oblasti-intellektualnogo-analiza-dannyh-tematicheskiy-analiz-publikatsiy-za-20-let (дата обращения: 20.12.2023)
2. Иванова Елена Владимировна, Цымблер Михаил Леонидович ОБЗОР СОВРЕМЕННЫХ СИСТЕМ ОБРАБОТКИ ВРЕМЕННЫХ РЯДОВ // Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2020. №4. URL: https://cyberleninka.ru/article/n/obzor-sovremennyh-sistem-obrabotki-vremennyh-ryadov (дата обращения: 20.12.2023).
3. Копырин А. С., Макарова И. Л. Алгоритм препроцессинга и унификации временных рядов на основе машинного обучения для структурирования данных //Программные системы и вычислительные методы. – 2020. – №. 3. – С. 40-50.
4. Волошин Тарас Андреевич, Зайцев Константин Сергеевич, Дунаев Максим Евгеньевич ПРИМЕНЕНИЕ АДАПТИВНЫХ АНСАМБЛЕЙ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ К ЗАДАЧЕ ПРОГНОЗИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ // International Journal of Open Information Technologies. 2023. №8. URL: https://cyberleninka.ru/article/n/primenenie-adaptivnyh-ansambley-metodov-mashinnogo-obucheniya-k-zadache-prognozirovaniya-vremennyh-ryadov (дата обращения: 20.12.2023)
5. Чернышова Галина Юрьевна, Самаркина Екатерина Александровна Методы интеллектуального анализа данных для прогнозирования финансовых временных рядов // Изв. Сарат. ун-та Нов. сер. Сер. Экономика. Управление. Право. 2019. №2. URL: https://cyberleninka.ru/article/n/metody-intellektualnogo-analiza-dannyh-dlya-prognozirovaniya-finansovyh-vremennyh-ryadov (дата обращения: 20.12.2023
6. Татьянок, В. Г. Сравнительный анализ методов машинного обучения / В. Г. Татьянок, П. В. Воронина // Информационно-аналитические и интеллектуальные системы в промышленности и социальной сфере : сборник научных трудов общеуниверситетской конференции студентов и молодых ученых, Москва, 15 апреля 2019 года / Отв. ред. В. О. Новицкий. – Москва: федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Московский государственный университет пищевых производств" , 2019. – С. 135-146
7. Колесников И. Н., Финогеев А. Г. Проактивный мониторинг событий на основе предиктивного анализа временных рядов //Модели, системы, сети в экономике, технике, природе и обществе. – 2020. – №. 1. – С. 111-125.
8. Гайлитис В. С., Жиленкова Е. П. СТАТИСТИЧЕСКИЕ МЕТОДЫ В ИНТЕЛЛЕКТУАЛЬНОМ АНАЛИЗЕ ДАННЫХ: ТЕОРЕТИЧЕСКИЕ ОСНОВЫ //Статистический анализ социально-экономического развития субъектов Российской Федерации. – 2022. – С. 58-61.
9. Огнев Г. Г., Щетинин Е. Ю. Исследование глубоких нейронных сетей с LSTM архитектурой для прогнозирования финансовых временных рядов //Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем. – 2020. – С. 280-283.
10. Чернышов Ю. Ю. Актуальные направления исследований с использованием машинного обучения в задачах кибербезопасности //Безопасность информационного пространства. – 2023. – С. 11-16.
11. Кислицын А. А., Рябова Н. В., Конкин Н. А. МЕТОД ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ ПРОГНОЗИРОВАНИЯ ЗНАЧЕНИЙ ПОЛОСЫ КОГЕРЕНТНОСТИ ИЗМЕНЯЮЩЕГОСЯ ТРАНСИОНОСФЕРНОГО РАДИОКАНАЛА //Международная Байкальская молодежная научная школа по фундаментальной физике. – 2022. – С. 361-363.