Полное название проекта:
Программный комплекс алгоритмов интеллектуального анализа данных для решения задачи классификации
Статус: 
3 место
Год: 
2015
Автор
Фамилия, имя, отчество:
Полякова Анастасия Сергеевна
Место учёбы (работы):
Сибирский Государственный Аэрокосмический Университет
Научный руководитель
Фамилия, имя, отчество: 
Семенкин Евгений Станиславович
Место работы: 
Сибирский государственный аэрокосмический университет имени М. Ф. Решетнева
Проект
Номинация: 
Программирование
Сроки работы над проектом: 
2014-2015
Описание: 

В интеллектуальном анализе данных применяется математический анализ для выявления закономерностей и тенденций, существующих в данных.

Эти закономерности и тренды можно собрать вместе и определить как модель интеллектуального анализа данных. Модели интеллектуального анализа данных могут применяться к конкретным сценариям, например к группированию: разделение параметров или событий на кластеры связанных элементов, анализ и прогнозирование их общих черт.

Среди методов интеллектуального анализа данных особое место занимают классификация и кластеризация. Когда необходимо классифицировать большие объемы информации на пригодные для дальнейшей обработки группы, кластерный анализ оказывается полезным и эффективным. Впервые к задаче классификации применяется подход предварительной кластеризации данных. Процесс кластеризации зависит от выбранного метода. Для каждого метода необходимо ставить множество экспериментов по выбору разнообразных параметров, например, меры расстояния, типа стандартизации переменных, количества кластеров и т.д. Именно от вариации комбинаций этих параметров зависит качество решения задачи.

В каждом кластере для решения задачи классификации применяется несколько методов интеллектуального анализа данных: искусственные нейронные сети, системы на нечеткой логике, метод опорных векторов, линейная регрессия, а также алгоритм k-средних. Для кластеризации применяются иерархические алгоритмы и алгоритм k-средних.

Разработанный подход был применен к решению задачи распознавания эмоций, которая представляет собой задачу классификации (обучение с учителем). В процессе решения задачи идентификации эмоций предварительная кластеризация подразумевает под собой предварительное разбиение эмоций на группы (кластеры), в каждом из которых задачу классификации решает лучший алгоритм.

В результате решения задачи распознавания эмоций были показаны преимущества и эффективность применения разработанного подхода. Полученные результаты являются статистически значимыми.

Собственный компьютер: 
буду использовать собственный компьютер (ноутбук)
Адрес в Интернет: 
нет
Используемые технологии и инструменты
Языки программирования и разметки: 
C/C++
Среды разработки и текстовые редакторы: 
Borland C++ Builder
Другие: 
CodeBlocks, Embarcadero Rad Studio