Полное название проекта:
Классификация фамилий по этническим группам
Статус: 
Допущен к очному туру
Год: 
2007
Автор
Фамилия, имя, отчество:
Савин Егор Михайлович
Место учёбы (работы):
ГОУ ВПО "Сибирский Государственный Технологический Университет"
Научный руководитель
Фамилия, имя, отчество: 
Жуков Леонид Александрович
Место работы: 
СибГТУ
Проект
Номинация: 
Дебют
Сроки работы над проектом: 
2006-2007
Описание: 

Тема нашего исследования – «Классификация фамилий с помощью нейронных сетей». Возникает вопрос, что такое интеллект. Ученые, представляющие разные науки, отвечают на этот вопрос по-своему. Нас интересует не просто интеллект, а интеллект искусственный, то есть связанный с информационными технологиями.
Человек, создавая технические устройства, всегда искал аналогию с природой. С искусственным интеллектом произошло все так же.
Что является основой интеллекта? Человеческий мозг, состоящий из огромного количества нейронов и синапсов. В плане информационных технологий, основу искусственного интеллекта, можно назвать нейронными сетями.
Принцип работы нейронных сетей такой же, как у их биологического аналога - мозга. Этот принцип можно образно сравнить с принципом обучаемости ребенка. То есть, нейронным сетям, дается некая информация. И они по ней обучаются. Нейронные сети сродни интеллекту, который получает и обрабатывает информацию. Применение нейронных сетей оправдано, если:
• отсутствует алгоритм или неизвестны принципы решения задач, но накоплено достаточное число примеров;
• проблема характеризуется большими объемами входной информации;
• данные неполны или избыточны, зашумлены, частично противоречивы.
Работу нейросетей мы рассмотрим на примере нашего проекта.
Цель нашей работы – демонстрация большого потенциала нейронных сетей в решении задач классификации, оптимизации, прогнозирования, моделирования.
Задача данного проекта – показать возможности обучения нейронной сети на примере освоения ею принципов классификации фамилий по принадлежности к различным этническим группам.
То есть, мы обучаем нейронную сеть принципам распознавания и определения того, к какой из этнических групп относиться та или иная фамилия из заданной базы данных.
Для выполнения задачи в базу данных (обучающую выборку) было включено около 200 фамилий, разделенных на 6 групп. Русские фамилии это 1-ая группа, украинские 2-ая, еврейские 3-я, чешские 4-ая, белорусские 5-ая и польские это 6-ая группа. Номера у групп это закодированный ответ, который записывается в выходном поле.
Так как нейронные сети «понимают» только цифры, каждая буква фамилии была закодирована цифрой по порядку их расположения в русском алфавите. К примеру, фамилия Иванов – 9,3,1,14,15,3. То есть, буква «а» это цифра 1. буква о…
У всех фамилии разное количество букв. Чтобы нейросеть смогла сравнивать их нам пришлось выравнивать их по началу(приставка, корень) и по концу(суффикс и окончание).
То, что нейронная сеть нашла логику распознавания фамилии, показывает нам таблица 2 «Значимость входных сигналов». Самым значимым для сети входным сигналом оказался «k_9», в котором была зашифрована предпоследняя буква фамилии. То есть суффикс или окончание. У разных фамилий, относящихся к одной этнической группе, как правило, суффиксы и окончания одинаковые. И нейронная сеть освоила этот принцип классификации, обучилась ему!
После проделанной нами работы, можно сказать, что нейронные сети чрезвычайно эффективны. Это беспристрастный механизм, не подверженный эмоциям и мнениям. Работоспособность зависит только от качества и количества введенных в него данных. Чем больше качественных примеров, тем лучше и качественней будет работать механизм и нейронная сеть в целом.
Из этого следует, что за нейронными сетями, будущее. На их основе возможна разработка самообучающихся роботов, которые смогут выполнять вместо человека различную работу.
Конечно, на этом работа над программой еще не закончена. В перспективе предстоит создание Интернет портала в основе которой будут лежать нейронные сети