Рефераты - Афоризмы - Словари
Русские, белорусские и английские сочинения
Русские и белорусские изложения

Динамическая модель кластеризации финансово-экономического состояния предприятия

Работа из раздела: «Экономико-математическое моделирование»

/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное бюджетное образовательное учреждение

высшего профессионального образования

'КУБАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ'

(ФГБОУ ВПО 'КубГУ')

Кафедра прикладной математики

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ

(ДИПЛОМНАЯ) РАБОТА

ДИНАМИЧЕСКАЯ МОДЕЛЬ КЛАСТЕРИЗАЦИИ ФИНАНСОВО-ЭКОНОМИЧЕСКОГО СОСТОЯНИЯ ПРЕДПРИЯТИЯ

Работу выполнила Ф.Н. Болурова

Научный руководитель зав. кафедрой д. ф. - м. н.,

профессор М.Х. Уртенов

Нормоконтролер магистр педагогики О.Н. Свистунова

Краснодар 2013

Содержание

Введение

Результатом финансового, инвестиционного и производственного развития предприятия является его финансово-экономическое состояние. В настоящее время, в условиях рыночных отношений, повышаются роль оценки и значение анализа финансового состояния предприятия, несущего полную экономическую ответственность за результаты производственно-хозяйственной деятельности перед акционерами, работниками, банками и кредиторами.

Финансовое состояние предприятия является гарантом эффективной реализации экономических интересов участников финансовых отношений и определяет его конкурентоспособность и потенциал в деловом сотрудничестве.

Анализ финансового состояния предприятия является важной и актуальной проблемой, как для каждого предприятия, так и для государства в целом. Раньше при анализе состояния предприятия вводили разного рода лимиты, фонды, и из главных показателей выделяли прибыль. По этому показателю и судили о финансовом состоянии предприятия.

В настоящее время такой подход невозможен, так как каждое предприятия в условиях рыночных отношений заинтересовано в стабильности, платежеспособности, возможностях экономического роста, в современных методах оценки и анализа. В связи с этим важно уже не столько учитывать размер прибыли, сколько определять уровень платежеспособности, финансовую устойчивость, деловую активность, рентабельность.

Применяемые в России методы анализа финансово-экономического состояния предприятия отстают от развития рыночной экономики. Многие вопросы и проблемы такие, как оценка состояния предприятия методами современного многомерного статистического анализа, нейронными сетями и нечеткими продукционными системами исследованы с недостаточной полнотой.

Таким образом, тема дипломной работы, посвященной созданию и разработке динамической модели кластеризации финансово-экономического состояния предприятия, является актуальной.

Целью дипломной работы является разработка динамической модели кластеризации финансово-экономического состояния предприятия, а именно проведение современных методов кластерного анализа, таких как многомерный статистический кластерный анализ, нечеткая кластеризация, нейросетевая кластеризация сетями Кохонена и классификация многослойным персептроном для анализа финансово-экономической оценки состояния предприятий, а также разработка динамической модели финансово-экономического состояние предприятия.

Для решения выше поставленной цели поставлены следующие основные задачи анализа финансово-экономической оценки состояния предприятия:

- провести многомерный статистический кластерный анализ исходных и нормированных данных по 15 основным показателям;

- осуществить нечеткую кластеризацию с помощью нечеткой продукционной системы MatLab;

- осуществить нейросетевую кластеризацию с помощью многослойного персептрона и сетями Кохонена;

- провести сопоставительный анализ и дать оценку построенных моделей;

- построить динамическую модель изменения финансово-экономического состояния предприятия.

Объектом исследования являются следующие предприятия:

1 Открытое акционерное общество 'Агроинвестсоюз'. Основные направления - производство зерна и частичная его переработка, хранение и продажа продукции растениеводства. Располагая природным, производственным и научным потенциалом, край способен обеспечивать не только внутренние потребности в зерне картофеле, овощебахчевой продукции, но и поставлять данную продукцию на рынки регионов России, а также стран ближнего и дальнего зарубежья.

2 Основной деятельностью открытого акционерного общества 'Ахтырский хлебозавод' является производство хлеба и мучных кондитерских изделий недлительного хранения.

3 Открытое акционерное общество 'Имени Карла Маркса' относится к отрасли рыболовства. Основные виды деятельности: Рыболовство, рыбоводство и предоставление услуг в этих областях, вылов рыбы и водных биоресурсов в открытых районах Мирового океана и внутренних морских водах сельскохозяйственными товаропроизводителями.

4 Открытое акционерное общество 'Армавирское полиграфпредприятие'. Основной деятельностью является издательская и полиграфическая деятельность, брошюровочно-переплётная и отделочная деятельность, изготовление печатей и штампов, розничная торговля.

5 Открытое акционерное общество 'Проектный институт 'Анапагражданпроект'. Основным видом деятельности ОАО 'ПИ 'Анапагражданпроект' является разработка всех видов градостроительной документации, проектных работ и инжиниринговых услуг по жилищно-гражданскому, коммунальному и городскому строительству.

6 Открытое акционерное общество 'Югмонтажстрой' является строительной фирмой. Основными видами деятельности являются строительство, строительство жилья, капитальный ремонт зданий.

7 Открытое акционерное общество 'Керамик'. Основной вид деятельности: производство кирпича керамического марки М - 100. В настоящее время финансовое положение ОАО 'Керамик' стабильно. ОАО 'Керамик' является промышленным предприятием строительной индустрии расположенным в Щербинском районе, выпускающий полнотелый одинарный кирпич М - 100, с максимально допустимой проектной мощностью 12 млн. штук кирпича в год.

8 Открытое акционерное общество НПО 'Нефтегеофизприбор' было организовано в 1988 году, как приборостроительная организация по созданию средств вычислительной техники для обработки сейсмических данных. С 1991 года НПО изменило научно-исследовательское направление деятельности в связи с переводом из города Грозного основного кадрового состава специалистов в области разработки и конструирования аппаратуры для проведения промыслово-геофизических исследований скважин. Это направление стало основным в деятельности общества.

9 Открытое акционерное общество 'Металлист'. Основной вид деятельности: производство вентиляторов.

10 Открытое акционерное общество 'Сафьян'. Вид деятельности: производство обуви, ремонт обуви и прочих изделий из кожи, сдача внаем собственного нежилого недвижимого имущества.

Рассматриваемые 10 разнопрофильных предприятий являются открытыми акционерными обществами. Исследуемые предприятия взяты из разных отраслей. Данные по ОАО приведены за разные годы.

Предмет анализа - финансовая деятельность предприятий разных отраслей за 2009-20011 гг.

Практическая значимость дипломной работы заключается в том, что результаты исследовании и моделей, могут быть использованы в планировании финансовой политики предприятий. Для научных исследований.

Дипломная работа состоит из трех глав, введения, заключения и списка использованной литературы.

В первой главе изучаются теоретические основы анализа финансово-экономической оценки состояния предприятия и кризиса на предприятии.

Во второй главе подробно описаны современные методы кластерного анализа, такие как многомерный статистический кластерный анализ, нечеткая кластеризация, нейросетевая кластеризация сетями Кохонена и классификация многослойным персептроном для анализа финансово-экономической оценки состояния предприятий.

В третьей главе проводится многомерный статистический кластерный анализ в пакете STATISTICA, нечеткая кластеризация с помощью нечеткой продукционной системы MatLab, нейросетевая кластеризация многослойным персептроном и сетями Кохонена с использованием пакета STATISTICA Neural Networks. Проводится сопоставительный анализ и дается оценка построенных моделей, а также разрабатывается динамическая модель кластеризации финансово-экономического состояния предприятия.

В заключении проводится итог результатов дипломной работы.

динамическая кластеризация финансовый экономический

1. Теоретические основы финансово-экономического состояния предприятий

Финансовое состояние характеризуется системой показателей, отражающих реальные и потенциальные финансовые возможности фирмы как объекта по бизнесу, объекта инвестирования капитала, налогоплательщика. Хорошее финансовое состояние - это эффективное использование ресурсов, способность полностью и в сроки ответить по своим обязательствам, достаточность собственных средств для исключения высокого риска, хорошие перспективы получения прибыли и др. [3].

Плохое финансовое положение выражается в неудовлетворительной платежной готовности, в низкой эффективности использования ресурсов, в неэффективном размещении средств, их иммобилизации. Пределом плохого финансового состояния предприятия является состояние банкротства, т.е. неспособность предприятия отвечать по своим обязательствам.

Основная цель анализа - выявление и оценка тенденций развития финансовых процессов на предприятии. Менеджеру эта информация необходима для разработки адекватных управленческих решений по снижению риска и повышению доходности финансово-экономической деятельности предприятия, инвестору - для решения вопроса целесообразности инвестирования, банкам - для определения условий кредитования фирмы.

1.1 Основные показатели финансового состояния предприятия

Характеристика финансового состояния по данным баланса.

Согласно действующим нормативным документам баланс в настоящее время составляется в оценке нетто. Итог баланса дает ориентировочную оценку суммы средств, находящихся в распоряжении предприятия. Эта оценка является учетной и не отражает реальной суммы денежных средств, которую можно выручить за имущество, например, в случае ликвидации предприятия. Текущая 'цена' активов определяется рыночной конъюнктурой и может отклоняться в любую сторону от учетной, особенно в сторону инфляции.

В качестве инструментария для анализа финансово-экономического состояния предприятия широко используются финансовые коэффициенты - относительные показатели, представляющие собой отношение одних абсолютных финансовых показателей к другим.

Все они, как правило, распределяются по следующим группам:

а) показатели ликвидности платежеспособности;

б) показатели финансовой устойчивости;

в) показатели рентабельности (прибыльности);

г) показатели деловой активности (оборачиваемости активов).

д) менеджмент;

е) изучение динамики цен на товары и услуги;

ж) ставок налогообложения и процентных ставок по банковским кредитам и депозитам, курс эмиссионных ценных бумаг;

з) деятельности конкурентов на товарном и финансовом рынках и другие [8].

Информационной базой для расчета всех показателей являются:

- форма № 1 'Бухгалтерский баланс' и приложения к балансу;

- форма № 2 'Отчет о прибылях и убытках'.

Анализируя сравнительный баланс, необходимо обратить внимание на изменение удельного веса величины собственного капитала в стоимости имущества, на соотношения темпов роста дебиторской и кредиторской задолженности. При стабильной финансовой устойчивости у организации должна увеличиваться в динамике доля собственного оборотного капитала, темп роста заемного капитала, а темпы роста дебиторской и кредиторской задолженности должны уравновешивать друг друга.

В общих чертах признаками 'хорошего' баланса являются:

- увеличение валюты баланса в конце отчетного периода по сравнению с началом;

- превышение темпов прироста оборотных активов над темпами прироста внеоборотных активов;

- превышение собственного капитала организации над заемным капиталом и превышение темпов его роста над темпами роста заемного капитала;

- одинаковое соотношение темпов прироста дебиторской и кредиторской задолженности.

Для анализа финансово-экономического состояния предприятия будем использовать следующие финансовые коэффициенты:

а) Ликвидность и платежеспособность предприятия.

Платежеспособность предприятия определяется его возможностью и способностью одновременно и полностью выполнять платежные обязательства, вытекающие из торговых, кредитных и иных операций денежного характера [3].

Ликвидность предприятия определяется наличием у него ликвидных средств, к которым относятся наличные деньги, денежные средства на счетах в банках и легкореализуемые элементы оборотных ресурсов. Ликвидность отражает способность предприятия в любой момент совершать необходимые расходы.

б) Финансовая устойчивость организации.

Финансовая устойчивость предприятия определяется степенью обеспечения запасов и затрат собственными и заемными источниками их формирования, соотношением объемов собственных и заемных средств и характеризуется системой абсолютных и относительных показателей.

в) Рентабельность.

Рентабельность представляет собой такое использование средств, при котором организация не только покрывает свои затраты доходами, но и получает прибыль.

Доходность, т.е. прибыльность предприятия, может быть оценена при помощи как абсолютных, так и относительных показателей. Абсолютные показатели выражают прибыль, и измеряются в стоимостном выражении, т.е. в рублях. Относительные показатели характеризуют рентабельность и измеряются в процентах или в виде коэффициентов. Показатели рентабельности в гораздо меньшей мере находятся под влиянием инфляции, чем величины прибыли, поскольку они выражаются различными соотношениями прибыли и авансированных средств (капитала), либо прибыли и произведенных расходов (затрат) [3].

г) Деловая активность.

Анализ деловой активности предприятия позволяет выявить, насколько эффективно оно использует свои средства.

Деловую активность предприятия можно представить как систему качественных и количественных критериев.

Качественные критерии - это широта рынков сбыта, репутация предприятия, конкурентоспособность, наличие стабильных поставщиков и потребителей и т.п.

Количественные критерии деловой активности определяются абсолютными и относительными показателями. Среди абсолютных показателей следует выделить объем реализации произведенной продукции (работ, услуг), прибыль, величину авансированного капитала (активы предприятия). Целесообразно учитывать сравнительную динамику этих показателей.

1.2 Кризис на предприятии, причины, виды и последствия

Вступление экономики России в рыночные отношения, открытие отечественного рынка для товаров зарубежных предприятий поставили большинство российских организаций в сложное финансовое и экономическое положение. Результатом этого явились рост неплатежеспособности и последующее банкротство организаций [4].

В мире не было ни одной организации, которая в той или иной мере в своей производственно-хозяйственной деятельности не испытала на себе кризисные явления, экономические и финансовые проблемы, нередко приводящие к банкротству. Особая острота проявилась и проявляется в России в силу определенных особенностей перехода ее экономики на рыночные отношения. В связи с этим перед руководством организаций, органами государственной и муниципальной власти встают задачи предотвратить кризисные явления и обеспечить устойчивое положение организаций, ибо банкротство одних организаций часто вызывает ухудшение финансового состояния (платежеспособности) многих других.

Этапы возникновения кризиса можно представить следующей цепочкой: причины, симптомы, факторы.

Причина кризиса - события или явления, вследствие которых появляются симптомы и далее факторы кризиса.

Фактор кризиса - событие или зафиксированное состояние объекта, или установленная тенденция, свидетельствующая о наступлении кризиса [4].

Причинами могут быть финансово-экономические просчеты, общее положение экономики, низкая квалификация персонала, недостатки системы мотивирования. Симптомы кризиса - появление первых признаков отрицательных тенденций, устойчивость этих тенденций, деловые конфликты, нарастание финансовых проблем и другие, и тогда факторами кризиса будут снижение качества продукции, нарушение технологической дисциплины, рост и большая задолженность по кредитам и т.п.

Причины возникновения кризиса можно классифицировать на внешние и внутренние. Внешние определяют воздействие среды, в которой существует организация, а возникновение внутренних причин зависит от ситуации в самой организации. Внешние причины определяются состоянием экономики, деятельностью государства, состоянием отрасли, к которой относится рассматриваемая организация, а также воздействием стихии [8].

Кризисные ситуации, прежде всего, выражаются в колебаниях объема производства и сбыта продукции, роста кредиторской задолженности поставщикам, банкам, налоговым органам, в дефиците оборотных средств и т.п., так как именно эти причины служат предпосылкой появления состояния неплатежеспособности организации [4].

Рассматривая различные виды кризисов организаций, исследователи больше всего уделяют внимание финансовому кризису организации [4].

Применительно к организации кризисы можно классифицировать:

1) Технологический (производственный), при возникновении которого устаревшее оборудование и технология не позволяют выпускать качественную, конкурентоспособную продукцию, что приводит организацию к финансовым потерям;

2) Социальный (социально-управленческий), возникает в результате появления между работниками или их группами конфликтов, в том числе между рабочими и администрацией, управленческих конфликтов в аппарате управления и т.п. Указанные конфликты ведут к принятию неэффективных решений и к потерям времени на самом производстве;

3) Финансовый, возникающий в результате нерационального использования собственного капитала и заемных средств, неэффективного использования полученной прибыли, что влечет за собой опять же финансовые проблемы организации;

4) Организационный - возникает в результате несовершенства производственной структуры управления и структуры аппарата управления в организации, неэффективного распределения обязанностей, прав, полномочий и ответственности между уровнями управления, подразделениями аппарата и внутри между исполнителями;

5) Информационный, являющийся следствием ситуации, в которой получаемая информация не отражает изменений, происходящих на рынке, недостаточно достоверно отражает положение дел в самой организации. Все это вызывает возникновение и увеличение различных видов и потерь;

6) Кризис взаимодействия между собственниками организации или с властью, противоречия в их интересах, что не позволяет проводить эффективную политику и в результате приносит существенные потери организации [4].

В конечном итоге эти кризисы между собой достаточно тесно связаны и, как правило, отражаются на финансах организации.

Кризисы могут вызывать один другого или может возникать цепная реакция, когда один возникший кризис вызывает другой, а затем третий и т.д.

Опасность возникновения кризиса в организации существует всегда, поэтому необходимо осуществлять анализ и на его основе постоянный контроль с целью распознавания, прогнозирования и предупреждения кризисных ситуаций.

Кризис в организации не обязательно приводит к негативным последствиям. В таблице 1.1 приведены позитивные и негативные последствия кризиса.

Таблица 1.1 - Возможные последствия наступления кризисного состояния предприятия

Позитивные

Негативные

Ослабление кризиса

Усиление кризиса

Финансовое оздоровление организации (преодоление кризисного состояния)

Переход к новому кризису

Сохранение организации как юридического лица

Ликвидация организации (распродажа имущества организации)

Реструктуризация (преобразование) организации

Смена собственника

Для того чтобы распознать кризис, необходимо своевременно обнаружить симптомы, определить факторы, свидетельствующие о возможности наступления кризиса, и выявить его причины. Средствами обнаружения возможности наступления кризисной ситуации в организации служат интуиция и опыт, анализ и диагностика состояния. Их следует применять на всех этапах существования организации, ибо возможна ситуация, при которой она может войти в глубокий кризис на пике своего развития или при весьма благоприятной обстановке.

2. Современные методы и инструментальные средства кластерного анализа

2.1 Многомерный статистический кластерный анализ

Главное назначение кластерного анализа (от англ. cluster - гроздь, скопление) - разбиение множества исследуемых объектов и признаков на однородные в некотором смысле группы, или кластеры [11]. Методы кластерного анализа можно применять даже тогда, когда речь идет о простой группировке, в которой все сводится к образованию групп по количественному сходству.

Отличием кластерного анализа от других методов классификации является отсутствие обучающей выборки (классификация без обучения). Большое достоинство кластерного анализа в том, что он дает возможность производить разбиение объектов не по одному параметру, а по ряду признаков. Кроме того, многомерный кластерный анализ в отличие от большинства математико-статистических методов не накладывает никаких ограничений на вид рассматриваемых объектов и позволяет исследовать множество исходных данных практически произвольной природы.

Важное значение многомерный кластерный анализ имеет применительно к совокупностям временных рядов, характеризующих экономическое развитие (например, общехозяйственной и товарной конъюнктуры). Здесь можно выделять периоды, когда значения соответствующих показателей были достаточно близкими, а также определять группы временных рядов, динамика которых наиболее схожа.

Многомерный кластерный анализ можно использовать циклически. В этом случае исследование производится до тех пор, пока не будут достигнуты необходимые результаты. При этом каждый цикл здесь может давать информацию, которая способна сильно изменить направленность и подходы дальнейшего применения кластерного анализа. Этот процесс можно представить системой с обратной связью.

Задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся во множестве X, разбить множество объектов G на m (m - целое) кластеров Q1, Q2, …, Qm так, чтобы каждый объект Gj, принадлежал одному и только одному подмножеству разбиения. При этом объекты, принадлежащие одному и тому же кластеру, должны быть сходными, а объекты, принадлежащие разным кластерам, - разнородными [11].

Решением задачи кластерного анализа являются разбиения, удовлетворяющие критерию оптимальности. Этот критерий может представлять собой некоторый функционал, выражающий уровни желательности различных разбиений и группировок, который называют целевой функцией. Например, в качестве целевой функции может быть взята внутригрупповая сумма квадратов отклонений:

, (2.1)

где Xj - вектор измерений j-го объекта; - средний вектор измерений; j = 1, …, n.

Сходство между объектами Gi, Gj определим через понятие расстояния между векторами изменений Xi, Xj, так как интуитивно понятно, что чем меньше расстояние между объектами, тем они более схожи.

Напомним, что неотрицательная функция d (Xi, Xj) называется функцией расстояния (метрикой), если:

а) для всех Xi и Xj;

б) тогда и только тогда, когда Xi = Xj;

в) ;

г) .

Значение для Xi и Xj называются расстоянием между Xi и Xj и эквивалентно расстоянию между Gi и Gj соответственно выбранным характеристикам F1, F2, F3, …, Fk.

Перечислим часто употребляемые функции расстояний.

Euclidean distances (евклидова метрика) является наиболее популярной и вычисляется по формуле

. (2.2)

Square Euclidean distances (квадрат евклидова расстояния) используют, если необходимо придать больше веса более отдаленным друг от друга объектам [11].

City-block Manhattan distances (манхэттенское расстояние городских кварталов) вычисляют по формуле

. (2.3)

Для этой меры влияние отдельных больших разностей (выбросов) уменьшается, так как они не возводятся в квадрат.

Chebychev distances metric (расстояние Чебышева) рассчитывают по формуле

. (2.4)

и применяют, когда желают определить два объекта как различные, если они различаются по какой-либо одной координате.

Иногда необходимо увеличить или уменьшить вес, относящийся к размерности, для которой соответствующие объекты сильно отличаются. Это достигается с использованием Pover metric (степенного расстояния Минковского), находят по формуле

. (2.5)

Параметр p ответственен за постепенное взвешивание разностей по отдельным координатам, параметр r - за прогрессивное взвешивание больших расстояний между объектами. Если оба параметра равны 2, то это расстояние совпадает с расстоянием Евклида.

Percent disagreement (процент несогласия) используется в тех случаях, когда данные являются категориальными. Это расстояние вычисляется по формуле

. (2.6)

Все приведенные расстояния пригодны, если объекты кластеризации можно представить как точки в k-мерном пространстве. При решении большого количества задач из экономики объекты нельзя представить как точки в k-мерном пространстве. В этом случае целесообразно в качестве расстояния использовать 1 - Pearson r (1 минус коэффициент корреляции Пирсона).

Понятием, противоположным расстоянию, является понятие сходства между объектами Gi и Gj [11].

Неотрицательная вещественная функция S (Xi, Xj) = Sij называется мерой сходства, если:

а) ;

б) ;

в) .

Алгоритмов кластерного анализа достаточно много. Всех их можно подразделить на иерархические и неиерархические.

Иерархические (древовидные) процедуры - наиболее распространенные алгоритмы кластерного анализа по их реализации на ЭВМ. Различают агломеративные (от слова agglomerate - собирать) и итеративные дивизивные (от слова division - разделять) процедуры.

Принцип работы иерархических агломеративных (дивизивных) процедур состоит в последовательном объединении (разделении) групп элементов сначала самых близких (далеких), а затем все более отдаленных (близких) друг от друга. Большинство этих алгоритмов исходит из матрицы расстояний (сходства). К недостаткам иерархических процедур следует отнести громоздкость их вычислительной реализации. На каждом шаге алгоритмы требуют вычисления матрицы расстояний, следовательно, емкой машинной памяти и большого количества времени. В этой связи реализация таких алгоритмов при числе наблюдений, большем нескольких сотен, нецелесообразна, а в ряде случаев и невозможна.

Общий принцип работы агломеративного алгоритма следующий. На первом шаге каждое наблюдение Gi (I = 1, 2, …, n) рассматривается как отдельный кластер. В дальнейшем на каждом шаге работы алгоритма происходит объединение двух самых близких кластеров, и, с учетом принятого расстояния, по формуле пересчитывается матрица расстояний, размерность которой, очевидно, снижается на единицу. Работа алгоритма заканчивается, когда все наблюдения объединены в один класс. Большинство программ, реализующих алгоритм иерархической классификации, предусматривают графическое представление классификации в виде дендограммы.

В программе STATISTICA реализованы так называемые агломеративные методы минимальной дисперсии: joining (tree clustering) (древовидная кластеризация) и two-way joining (двухвходовая кластеризация), а также k-means (дивизивный метод k - средних).

В методе древовидной кластеризации предусмотрены различные правила иерархического объединения в кластеры [11].

- Правило single Linkage (одиночной связи). На первом шаге объединяются два наиболее близких объекта, то есть имеющие максимальную меру сходства. На следующем шаге к ним присоединяется объект с максимальной мерой сходства с одним из объектов кластера, то есть для его включения в кластер требуется максимальное сходство лишь с одним членом кластера.

Метод называют еще методом ближайшего соседа, так как расстояние между двумя кластерами определяется как расстояние между двумя наиболее близкими объектами в различных кластерах. Это правило 'нанизывает' объекты для формирования кластеров. Недостатком данного метода является образование слишком больших продолговатых кластеров.

- Правило complete Linkage (полных связей). Данный метод позволяет устранить недостаток, присущий методу одиночной связи. Суть правила в том, что два объекта, принадлежащих одной и той же группе (кластеру), имеют коэффициент сходства, который меньше некоторого порогового значения S. В терминах евклидова расстояния это означает, что расстояние между двумя точками (объектами) кластера не должно превышать некоторого порогового значения d. Таким образом, d определяет максимально допустимый диаметр подмножества, образующего кластер. Этот метод называют еще методом наиболее удаленных соседей, так как при достаточно большом пороговом значении d расстояние между кластерами определяется наибольшим расстоянием между любыми двумя объектами в различных кластерах.

- Правило unweighted pair-group average (невзвешенного попарного среднего). В данном методе расстояние между двумя кластерами определяется как среднее расстояние между всеми парами объектов в них. Метод эффективен, когда объекты в действительности формируют различные группы, однако он работает одинаково хорошо и в случаях протяженных (цепочного типа) кластеров.

- Weighted pair-group average (взвешенное попарное среднее). Метод идентичен предыдущему, за исключением того, что при вычислении размеры соответствующих кластеров используются в качестве весовых коэффициентов. Желательно этот метод использовать, когда предполагается неравные размеры кластеров.

- Unweighted pair-group centroid (невзвешенный центроидный). Расстояние между двумя кластерами определяется как расстояние между их центрами тяжести.

- Weighted pair-group centroid (взвешенный центроидный). Идентичен предыдущему, за исключением того, что при вычислениях используют веса для учета разности между размерами кластеров. Поэтому, если имеются (или подозреваются) значительные отличия в размерах кластеров, этот метод оказывается предпочтительнее предыдущего.

- Ward's method (метод Уорда). В этом методе в качестве целевой функции применяют внутригрупповую сумму квадратов отклонений, которая есть не что иное, как сумма квадратов расстояний между каждой точкой (объектом) и средней по кластеру, содержащему этот объект. На каждом шаге объединяются такие два кластера, которые приводят к минимальному увеличению целевой функции, то есть внутригрупповой суммы квадратов отклонений. Этот метод направлен на объединение близко расположенных кластеров. Замечено, что метод Уорда приводит к образованию кластеров примерно равных размеров и имеющих форму гиперсфер [11].

В модуле 'Кластерный анализ' также предусмотрена эффективная двухвходовая процедура (two-way joining), которая позволит кластеризовать сразу в двух направлениях - по наблюдениям и переменным.

Предположим, есть гипотезы относительно числа m кластеров (по переменным или наблюдениям). Тогда можно задать программе, создать ровно m кластеров так, чтобы они были настолько различны насколько это возможно. Именно для решения задач этого типа предназначен метод k-means (k - средних). Гипотеза может основываться на теоретических соображениях, результатах предшествующих исследований или догадке. Выполняя последовательное разбиение на различное число кластеров, можно сравнить качество получаемых решений. Чаще всего начинают анализ, пытаясь разбить совокупность объектов на две группы, затем увеличивают их число до трех, четырех и так далее. Программа начинает с m случайно выбранных кластеров, а затем изменяет принадлежность объектов к ним, чтобы минимизировать изменчивость внутри кластеров и максимизировать изменчивость между кластерами. Алгоритм случайным образом в пространстве назначает центры будущих кластеров. Затем вычисляет расстояние между центрами кластеров и каждым объектом, и объект приписывается к тому кластеру, к которому он ближе всего. Завершив приписывание, алгоритм вычисляет среднее значение для каждого кластера.

Этих средних будет столько, сколько используется переменных для проведения анализа, - k штук. Набор средних представляет собой координаты нового положения центра кластера. Алгоритм вновь вычисляет расстояние от каждого объекта до центов кластеров и приписывает объекты к ближайшему кластеру. Вновь вычисляются центры тяжести кластеров, и этот процесс повторяется до тех пор, пока центры тяжести не перестанут 'мигрировать' в пространстве.

Наиболее известный метод представления матрицы расстояний или сходства основан на идее дендограммы, или диаграммы дерева. Дендограмму можно определить как графическое изображение результатов процесса последовательной кластеризации, которая осуществляется в терминах матрицы расстояний. С помощью дендограммы можно графически или геометрически изобразить процедуру кластеризации при условии, что эта процедура оперирует только с элементами матрицы расстояний или сходств. Существует много способов построения дендограмм. В дендограмме объекты располагаются вертикально слева, результаты кластеризации - справа. Значения расстояний или сходств, отвечающих строению новых кластеров, изображаются над горизонтальной прямой поверх дендограмм. Вид дендограммы зависит от выбора меры сходства или расстояния между объектом и кластером и метода кластеризации [11].

Алгоритмы кластерного анализа имеют хорошую программную реализацию в пакете STATISTICA, которая позволяет решить задачи самой большой размерности.

2.2 Нейросетевая кластеризация

В последние несколько лет наблюдается взрыв интереса к нейронным сетям, которые успешно применяются в самых различных областях - бизнесе, медицине, технике, геологии, физике. Нейронные сети. STATISTICA Neural Networks - единственный в мире программный продукт для нейросетевых исследований, полностью переведенный на русский язык [2]. Нейронные сети вошли в практику везде, где нужно решать задачи прогнозирования, классификации или управления. Такой впечатляющий успех определяется несколькими причинами:

- Богатые возможности. Нейронные сети - исключительно мощный метод моделирования, позволяющий воспроизводить чрезвычайно сложные зависимости. В частности, нейронные сети нелинейны по своей природе. На протяжении многих лет линейное моделирование было основным методом моделирования в большинстве областей, поскольку для него хорошо разработаны процедуры оптимизации. В задачах, где линейная аппроксимация неудовлетворительна, линейные модели работают плохо. Кроме того, нейронные сети справляются с 'проклятием размерности', которое не позволяет моделировать линейные зависимости в случае большого числа переменных

- Простота в использовании. Нейронные сети учатся на примерах. Пользователь нейронной сети подбирает представительные данные, а затем запускает алгоритм обучения, который автоматически воспринимает структуру данных. При этом от пользователя требуется какой-то набор эвристических знаний о том, как следует отбирать и подготавливать данные, выбирать нужную архитектуру сети и интерпретировать результаты, однако уровень знаний, необходимый для успешного применения нейронных сетей, гораздо скромнее, чем, например, при использовании традиционных методов статистики.

Нейронные сети привлекательны с интуитивной точки зрения, ибо они основаны на примитивной биологической модели нервных систем. В будущем развитие таких нейробиологических моделей может привести к созданию действительно мыслящих компьютеров. Между тем уже 'простые' нейронные сети, которые строит система ST Neural Networks, являются мощным оружием в арсенале специалиста по прикладной статистике.

2.2.1 Многослойный персептрон (MLP)

На сегодняшний день многослойный персептрон - одна из самых популярных и используемых нейросетей. Она была предложена в работе Rumelhart, McClelland (1986). MLP работает в двух режимах - режиме обучения и режиме тестирования (работы обученной модели). MLP может иметь различное количество входов, выходов (обычно определяется постановкой задачи), скрытых слоев, нейронов на слое.

В процессе обучения в простейшем случае подбираются веса связей. Процесс преобразования входных величин идет по направлению связей сигнального графа. На входном слое каждая входная величина расходится по связям (по каждой исходящей из вершины входного слоя дуге идет 'сигнал” равный входной величине), умножается на вес дуги и суммируется на скрытом слое, а далее преобразуется передаточной функцией нейрона. На выходном слое обычно сигнал только суммируется.

Суть обучения заключается в решении задачи подбора параметров сети (весов связей) для минимизации функции ошибки. Причем из всех обучающих примеров часть используется только для контроля.

Обучение многослойного персептрона. После того, как определено число слоев и число элементов в каждом из них, нужно найти значения для весов и порогов сети, которые бы минимизировали ошибку прогноза, выдаваемого сетью. Именно для этого служат алгоритмы обучения. С использованием собранных исторических данных веса и пороговые значения автоматически корректируются с целью минимизировать эту ошибку. По сути, этот процесс представляет собой подгонку модели, которая реализуется сетью, к имеющимся обучающим данным. Ошибка для конкретной конфигурации сети определяется путем прогона через сеть всех имеющихся наблюдений и сравнения реально выдаваемых выходных значений с желаемыми (целевыми) значениями. Все такие разности суммируются в так называемую функцию ошибок, значение которой и есть ошибка сети. В качестве функции ошибок чаще всего берется сумма квадратов ошибок, т.е. когда все ошибки выходных элементов для всех наблюдений возводятся в квадрат и затем суммируются. При работе с пакетом ST Neural Networks пользователю выдается так называемая среднеквадратичная ошибка (RMS) - описанная выше величина нормируется на число наблюдений и переменных, после чего из нее извлекается квадратный корень - это очень хорошая мера ошибки, усредненная по всему обучающему множеству и по всем выходным элементам [2].

Алгоритмы обучения. Самый известный вариант алгоритма обучения нейронной сети - так называемый алгоритм обратного распространения. Алгоритм обратного распространения наиболее прост для понимания, а в некоторых случаях он имеет определенные преимущества. В алгоритме обратного распространения вычисляется вектор градиента поверхности ошибок. Этот вектор указывает направление кратчайшего спуска по поверхности из данной точки, поэтому если мы 'немного' продвинемся по нему, ошибка уменьшится. Последовательность таких шагов (замедляющаяся по мере приближения к дну) в конце концов приведет к минимуму того или иного типа. Определенную трудность здесь представляет вопрос о том, какую нужно брать длину шагов. При большой длине шага сходимость будет более быстрой, но имеется опасность перепрыгнуть через решение или (если поверхность ошибок имеет особо вычурную форму) уйти в неправильном направлении. Таким образом, алгоритм действует итеративно, и его шаги принято называть эпохами. На каждой эпохе на вход сети поочередно подаются все обучающие наблюдения, выходные значения сети сравниваются с целевыми значениями и вычисляется ошибка. Значение ошибки, а также градиента поверхности ошибок используется для корректировки весов, после чего все действия повторяются. Начальная конфигурация сети выбирается случайным образом, и процесс обучения прекращается либо когда пройдено определенное количество эпох, либо когда ошибка достигнет некоторого определенного уровня малости, либо когда ошибка перестанет уменьшаться (пользователь может сам выбрать нужное условие остановки) [2].

В некоторых задачах бывает целесообразно использовать более сложные методы нелинейной оптимизации. В пакете ST Neural Networks реализованы два подобных метода: методы спуска по сопряженным градиентам и Левенберга-Маркара, представляющие собой очень удачные варианты реализации двух типов алгоритмов: линейного поиска и доверительных областей.

Идея метода спуска по сопряженным градиентам состоит в следующем: поскольку мы нашли точку минимума вдоль некоторой прямой, производная по этому направлению равна нулю. Сопряженное направление выбирается таким образом, чтобы эта производная и дальше оставалась нулевой - в предположении, что поверхность имеет форму параболоида (или, грубо говоря, является 'хорошей и гладкой'). Если это условие выполнено, то для достижения точки минимума достаточно будет N эпох. На реальных, сложно устроенных поверхностях по мере хода алгоритма условие сопряженности портится, и тем не менее такой алгоритм, как правило, требует гораздо меньшего числа шагов, чем метод обратного распространения, и дает лучшую точку минимума (для того, чтобы алгоритм обратного распространения точно установился в некоторой точке, нужно выбирать очень маленькую скорость обучения).

Метод сопряженных градиентов проводят вычисления на всем наборе данных, поэтому при увеличении числа наблюдений продолжительность одной эпохи сильно растет, но при этом совсем не обязательно улучшается результат, достигнутый на этой эпохе (в частности, если данные избыточны; если же данные редкие, то добавление новых данных улучшит обучение на каждой эпохе). Кроме того, обратное распространение не уступает другим методам в ситуациях, когда данных мало, поскольку в этом случае недостаточно данных для принятия очень точного решения (более тонкий алгоритм может дать меньшую ошибку обучения, но контрольная ошибка у него, скорее всего, не будет меньше).

2.2.2 Сеть Кохонена

В то время как все остальные сети предназначены для задач с управляемым процессом обучения, сети Кохонена главным образом рассчитаны на неуправляемое обучение (Kohonen, 1982; Haykin, 1994; Patterson, 1996; Fausett, 1994) [2].

При управляемом обучении наблюдения, составляющие обучающие данные, вместе с входными переменными содержат также и соответствующие им выходные значения, и сеть должна восстановить отображение, переводящее первые во вторые. В случае же неуправляемого обучения обучающие данные содержат только значения входных переменных. На первый взгляд это может показаться странным. Как сеть может чему-то научиться, не имея выходных значений? Ответ заключается в том, что сеть Кохонена учится понимать саму структуру данных.

Одно из возможных применений таких сетей - разведочный анализ данных. Сеть Кохонена может распознавать кластеры в данных, а также устанавливать близость классов. Таким образом, пользователь может улучшить свое понимание структуры данных, чтобы затем уточнить нейросетевую модель. Если в данных распознаны классы, то их можно обозначить, после чего сеть сможет решать задачи классификации. Сети Кохонена можно использовать и в тех задачах классификации, где классы уже заданы, - тогда преимущество будет в том, что сеть сможет выявить сходство между различными классами.

Другая возможная область применения - обнаружение новых явлений. Сеть Кохонена распознает кластеры в обучающих данных и относит все данные к тем или иным кластерам. Если после этого сеть встретится с наблюдениями, непохожими ни на один из известных образцов, то она не сможет классифицировать такой набор и тем самым выявит его новизну.

Сеть Кохонена имеет всего два слоя: входной и выходной, составленный из радиальных элементов (выходной слой называют также слоем топологической карты). Элементы топологической карты располагаются в некотором пространстве, как правило, двумерном (в пакете ST Neural Networks реализованы также одномерные сети Кохонена) [2].

Обучается сеть Кохонена методом последовательных приближений. Начиная со случайным образом выбранного исходного расположения центров, алгоритм постепенно улучшает его так, чтобы улавливать кластеризацию обучающих данных. В некотором отношении эти действия похожи на алгоритмы выборки из выборки и K-средних, которые используются для размещения центров в сетях RBF и GRNN (Обобщенно-регрессионная нейронная сеть), и действительно, алгоритм Кохонена можно использовать для размещения центров в сетях этих типов. Однако данный алгоритм работает и на другом уровне.

Помимо того, что уже сказано, в результате итеративной процедуры обучения сеть организуется таким образом, что элементы, соответствующие центрам, расположенным близко друг от друга в пространстве входов, будут располагаться близко друг от друга и на топологической карте. Топологический слой сети можно представлять себе как двумерную решетку, которую нужно так отобразить в N-мерное пространство входов, чтобы по возможности сохранить исходную структуру данных. Конечно же, при любой попытке представить N-мерное пространство на плоскости будут потеряны многие детали; однако, такой прием иногда полезен, так как он позволяет пользователю визуализировать данные, которые никаким иным способом понять невозможно.

Основной итерационный алгоритм Кохонена состоит из нескольких последовательных эпох, на каждой из которых нужно обработать каждый из обучающих примеров и выполнить определенный набор операций:

а) выбрать выигравший нейрон (то есть тот, который расположен ближе всего к входному примеру);

б) скорректировать выигравший нейрон так, чтобы он стал более похож на этот входной пример (взяв взвешенную сумму прежнего центра нейрона и обучающего примера) [2].

В алгоритме при вычислении взвешенной суммы используется постепенно убывающий коэффициент скорости обучения, для того чтобы на каждой новой эпохе коррекция становилась все более тонкой. В результате положение центра установится в некоторой позиции, которая удовлетворительным образом представляет те наблюдения, для которых данный нейрон оказался выигравшим.

Свойство топологической упорядоченности достигается в алгоритме с помощью дополнительного использования понятия окрестности. Окрестность - это несколько нейронов, окружающих выигравший нейрон. Подобно скорости обучения, размер окрестности убывает со временем, так что вначале к ней принадлежит довольно большое число нейронов (возможно, почти вся топологическая карта); на самых последних этапах окрестность становится нулевой (т.е. состоящей только из самого выигравшего нейрона). На самом деле в алгоритме Кохонена корректировка применяется не только к выигравшему нейрону, но и ко всем нейронам из его текущей окрестности.

Идея сети Кохонена возникла по аналогии с некоторыми известными свойствами человеческого мозга. Кора головного мозга представляет собой большой плоский лист площадью около 0,5 кв. м. (чтобы поместиться в черепе, она свернута складками) с известными топологическими свойствами. Например, участок, ответственный за кисть руки, примыкает к участку, ответственному за движения всей руки, и таким образом все изображение человеческого тела непрерывно отображается на эту двумерную поверхность.

Недостаток сети Кохонена в том, что сеть может быть использована для кластерного анализа только в том случае, если заранее известно число кластеров.

Преимущество сети в том, что сеть Кохонена способна функционировать в условиях помех, так как число классов фиксировано, веса модифицируются медленно, настройка весов заканчивается после обучения.

2.3 Нечеткие системы кластеризации

Многомерный кластерный анализ занимает одно из центральных мест среди методов анализа данных и представляет собой совокупность подходов, методов и алгоритмов, предназначенных для нахождения некоторого разбиения исследуемой совокупности объектов на подмножества относительно сходных, похожих между собой объектов. При этом исходным допущением для выделения таких подмножеств, получивших специальное название кластеров, которые иногда называют также таксонами или просто классами, служит лишь неформальное предположение о том, что объекты, относимые к одному кластеру, должны иметь большее сходство между собой, чем с объектами из других кластеров [6].

Таким образом, выявление или нахождение кластеров во множестве данных исследуемой совокупности должно удовлетворять следующим требованиям:

а) каждый кластер должен представлять собой концептуально однородную категорию и содержать похожие объекты с близкими значениями свойств или признаков;

б) совокупность всех кластеров должна быть исчерпывающей, т.е. охватывать все объекты исследуемой совокупности;

в) кластеры должны быть взаимно исключающими, т.е. ни один из объектов исследуемой совокупности не должен одновременно принадлежать двум различным кластерам.

Концептуальная взаимосвязь между кластерным анализом и теорией нечетких множеств основана на том обстоятельстве, что при решении задач структуризации сложных систем большинство формируемых классов объектов размыты по своей природе. Эта размытость состоит в том, что переход от принадлежности к непринадлежности элементов к данным классам скорее постепенен, чем скачкообразен. Поэтому наиболее адекватный ответ в подобного рода случаях следует искать не на вопрос: 'Принадлежит ли рассматриваемый элемент тому или иному классу или нет?', а на вопрос: 'В какой степени данный элемент принадлежит рассматриваемому классу?' [6].

В общем случае задачей нечеткой кластеризации является нахождение нечеткого разбиения или нечеткого покрытия множества элементов исследуемой совокупности, которые образуют структуру нечетких кластеров, присутствующих в рассматриваемых данных. Эта задача сводится к нахождению степеней принадлежности элементов универсума искомым нечетким кластерам, которые в совокупности и определяют нечеткое разбиение или нечеткое покрытие исходного множества рассматриваемых элементов. Ниже приводится формальная постановка задачи нечеткой кластеризации и описание одного из наиболее конструктивных алгоритмов ее решения.

2.3.1 Общая формальная постановка задачи нечеткого кластерного анализа

Пусть исследуемая совокупность данных представляет собой конечное множество элементов A={al, а2,., аn}, которое получило название множество объектов кластеризации. В рассмотрение также вводится конечное множество признаков или атрибутов P={pI,p2,.,pq}, каждый из которых количественно представляет некоторое свойство или характеристику элементов рассматриваемой проблемной области. При этом натуральное n определяет общее количество объектов данных, а натуральное q общее количество измеримых признаков объектов [6].

Далее предполагается, что для каждого из объектов кластеризации некоторым образом измерены все признаки множества Р в некоторой количественной шкале. Тем самым каждому из элементов поставлен в соответствие некоторый вектор , где - количественное значение признака для объекта данных . Для определенности будем полагать, что все принимают некоторые действительные значения, т.е. .

Процесс измерения свойств может быть реализован в различных шкалах, каждая из которых характеризуется допустимым преобразованием данных. Само множество признаков следует выбирать таким образом, чтобы все были измерены в шкале отношений или шкале интервалов. Именно в этом случае результаты нечеткой кластеризации имеют содержательную интерпретацию, адекватную проблеме нахождения нечетких кластеров [6].

Векторы значений признаков удобно представить в виде матрицы данных D размерности , каждая строка которой равна значению вектора .

Задача нечеткого кластерного анализа формулируется следующим образом:

на основе исходных данных D определить такое нечеткое разбиение или нечеткое покрытие множества A на заданное число c нечетких кластеров , которое доставляет экстремум некоторой целевой функции среди всех нечетких разбиений или экстремум целевой функции среди всех нечетких покрытий.

2.3.2 Уточненная постановка задачи нечеткой кластеризации

Один из вариантов конкретизации задачи нечеткого кластерного анализа, для решения которой может быть использована специальная функция fcm системы MATLAB, основан на алгоритме ее решения методом нечетких с-средних. Дадим определение нечеткому покрытию нечеткого множества. Система нечетких подмножеств нечеткого множества А называется нечетким покрытием, если выполняется следующее условие:

(2.3.1)

т.е. объединение всех (или части) подмножеств из совпадает (или 'покрывает') с исходным нечетким множеством А.

Для уточнения вида целевой функции в рассмотрение вводятся некоторые дополнительные понятия. Прежде всего предполагается, что искомые нечеткие кластеры представляют собой нечеткие множества А, образующие нечеткое покрытие исходного множества объектов кластеризации А=А, для которого условие (2.3.1) принимает следующий вид:

(2.3.2)

где с-общее количество нечетких кластеров, которое считается предварительно заданным [6].

Далее для каждого нечеткого кластера вводятся в рассмотрение так называемые типичные представители или центры vk искомых нечетких кластеров , которые рассчитываются для каждого из нечетких кластеров и по каждому из признаков по следующей формуле:

(2.3.3)

где m-некоторый параметр, называемый экспоненциальным весом и равный некоторому действительному числу (m > 1). Каждый из центров кластеров представляет собой вектор в некотором q-мерном нормированном пространстве, изоморфном , т.е. , если все признаки измерены в шкале отношений [6].

Наконец, в качестве целевой функции будем рассматривать сумму квадратов взвешенных отклонений координат объектов кластеризации от центров искомых нечетких кластеров:

(2.3.4)

где m-экспоненциальный вес нечеткой кластеризации , значение которого задается в зависимости от количества элементов (мощности) множества А. Чем больше элементов содержит множество А, тем меньшее значение выбирается для m.

Задача нечеткой кластеризации может быть сформулирована следующим образом: для заданных матрицы данных D, количества нечетких кластеров с, параметра m определить матрицу U значений функций принадлежности объектов кластеризации нечетким кластерам , которые доставляют минимум целевой функции (2.3.4) и удовлетворяют ограничениям (2.3.2), (2.3.3), а также дополнительным ограничениям (2.3.5) и (2.3.6):

(2.3.5)

(2.3.6)

Условие (2.3.5) исключает появление пустых нечетких кластеров в искомой нечеткой кластеризации. Последнее условие (2.3.6) имеет формальный характер, поскольку непосредственно следует из определения функции принадлежности нечетких множеств. В этом случае минимизация целевой функции (2.3.4) минимизирует отклонение всех объектов кластеризации от центров нечетких кластеров пропорционально значениям функций принадлежности этих объектов соответствующим нечетким кластерам [6].

Поскольку целевая функция (2.3.3) не является выпуклой, а ограничения (2.3.2), (2.3.3), (2.3.5), (2.3.6) в своей совокупности формируют невыпуклое множество допустимых альтернатив, то в общем случае задача нечеткой кластеризации относится к многоэкстремальным задачам нелинейного программирования.

Достоинством постановки задачи нечеткой кластеризации в виде (2.3.2) (2.3.6) является естественная интерпретация как искомых нечетких кластеров, определяемых функциями принадлежности (2.3.6), так и их типичных представителей или центров (2.3.3), которые также определяются в результате решения поставленной задачи.

Недостатком данной постановки задачи нечеткой кластеризации является необходимость априорного задания общего числа нечетких кластеров с, которое в отдельных случаях может быть неизвестно. Это обстоятельство может потребовать привлечения дополнительных процедур для его определения либо решения поставленной задачи для нескольких значений с с последующим выбором наиболее адекватного результата нечеткой кластеризации.

Подводя итоги, можно сделать следующие выводы:

- Многомерный статистический кластерный анализ используется для понимания данных путём выявления кластерной структуры, разбиение выборки на группы схожих объектов позволяет упростить дальнейшую обработку данных и принятия решений, применяя к каждому кластеру свой метод анализа, сжатие данных, обнаружение новизны (выделяются нетипичные объекты, которые не удаётся присоединить ни к одному из кластеров);

- Нейронные сети вошли в практику везде, где нужно решать задачи прогнозирования, классификации или управления;

- Одно из главных преимуществ многослойного персептрона, это возможность решать алгоритмически неразрешимые задачи или задачи, для которых алгоритмическое решение неизвестно, но для которых возможно составить репрезентативный набор примеров с известными решениями;

- Самоорганизующиеся карты Кохонена могут использоваться для решения таких задач, как моделирование, прогнозирование, поиск закономерностей в больших массивах данных, выявление наборов независимых признаков и сжатие информации. Наиболее распространенное применение сетей Кохонена - решение задачи классификации без учителя, т.е. кластеризации;

- Задачей нечеткой кластеризации является нахождение нечеткого разбиения или нечеткого покрытия множества элементов исследуемой совокупности, которые образуют структуру нечетких кластеров, присутствующих в рассматриваемых данных.

3. Использование методов кластерного анализа для финансово-экономической оценки состояния предприятия

3.1 Многомерный статистический кластерный анализ финансово-экономического состояния предприятия

Многомерный кластерный анализ широко используется в экономических исследованиях, в то время как его возможности для исследования состояния предприятия используются не достаточно.

Многомерный кластерный анализ позволяет разбивать множество исследуемых объектов и признаков на однородные группы по ряду признаков произвольной природы. Алгоритмы кластерного анализа подразделяются на иерархические (древовидные) и неиерархические, агломеративные и итеративные дивизивные процедуры [11].

Задача многомерного кластерного анализа заключается в том, чтобы на основании данных разбить предприятия на кластеры таким образом, чтобы предприятия, принадлежащее одному и тому же кластеру были схожи между собой, в то время как другие предприятия, принадлежащие разным кластерам, были различны, и выявить финансово-экономическое состояние предприятий.

Для проведения анализа состояния предприятий возьмем количественные финансовые показатели (Рисунок 3.1). Многомерный кластерный анализ предприятий будем проводить для исходных и нормированных данных.

Выбор именно таких показателей основан на исследовании [7], в ходе которого были проанализированы бухгалтерские отчетности 400 российских предприятий, были построены гистограммы исследуемых факторов и получены общие закономерности, которым подчиняются финансовые показатели российских предприятий.

Для решения задачи оценки финансово-экономического состояния предприятия методом кластерного анализа загрузим в пакет STATISTICA исходные данные предприятий по основным показателям.

На рисунке 3.2 показана таблица, содержащая 15 показателей по 10 предприятиям за разные годы. Сложность данной задачи состоит в том, что предприятия нужно сравнить не по одному показателю, а по 15 показателям одновременно.

Для начала исследуем дивизивный метод k-средних. Кластеризуем предприятия на кризисные, предкризисные и некризисные, то есть число кластеров возьмем равное трем. Начальные центры кластеров зададим методом сортировки расстояний и выбора наблюдений на постоянных интервалах (Рисунок 3.3).

Результаты кластеризации исходных данных предприятий представлены в рисунках 3.4-3.5.

На рисунке 3.4 приведены значения межгрупповых (Между SS) и внутригрупповых (Внутри SS) дисперсий признаков. Чем меньше значение внутригрупповой дисперсии и больше значение межгрупповой дисперсии, тем лучше признак характеризует принадлежность объектов к кластеру и тем 'качественнее' кластеризация. Параметры F и p также характеризуют вклад признака в разделение объектов на группы. Лучшей кластеризации соответствует большие значения первого и меньшие значения второго параметра. Можно сделать вывод, что признаки: обеспеченность запасов собственными оборотными средствами (F3), оборачиваемость кредиторской задолженности (A5) и оборачиваемость запасов (A6) наиболее информативны для процесса кластеризации, т.е. для 'грубой' экспресс-оценки состояния предприятия достаточно исследование именно этих коэффициентов. А остальные признаки можно исключить из процедуры кластеризации.

Евклидовы расстояния и квадраты евклидовых расстояний между кластерами показаны на рисунке 3.6.

Среднее значение для каждого кластера приведены на рисунке 3.7 Однако, из-за того что показатели не нормированы невозможно визуально оценить кластеризацию предприятий. Особенно это связано со значениями показателей оборачиваемости кредиторской задолженности (A5) и оборачиваемости запасов (A6).

Построим таблицы распределения предприятий по кластерам (Рисунок 3.8). Анализируя данные в таблицах, получаем следующую оценку состояния предприятий.

Ко второму кластеру (предкризисные) относятся предприятия: ОАО 'Проектный институт 'Анапагражданпроект' 2009 и ОАО 'Проектный институт 'Анапагражданпроект' 2010.

К третьему кластеру (кризисные) относятся предприятия: ОАО ' Имени Карла Маркса' 2010, ОАО ' Имени Карла Маркса' 2011, ОАО ' Армавирское полиграфпредприятие' 2009, ОАО ' Армавирское полиграфпредприятие' 2010 и ОАО ' Армавирское полиграфпредприятие' 2011.

Остальные предприятия относятся к первому кластеру (некризисные).

Теперь проведем кластеризацию агломеративным методом древовидной кластеризации. В качестве правила иерархического объединения в кластеры выберем метод одиночной связи (Рисунок 3.9).

Рассмотрим горизонтальную иерархическую древовидную диаграмму (Рисунок 3.10-3.11).

Первый кластер образуют наиболее схожие признаки: общая рентабельность (R1) и рентабельность продукции (продаж) (R4), второй кластер образуют быстрый коэффициент ликвидности (L1) и текущий коэффициент ликвидности (P1). Все остальные коэффициенты характеризуют различные стороны финансового состояния предприятия, образуют отдельные кластеры и постепенно присоединяются к первым кластерам.

На рисунке 3.11 представлена диаграмма исследуемых признаков предприятия наиболее отличающихся диапозоном значений, средними и стандартными отклонениями от исследуемых 15 признаков предприятия за исключением признака оборачиваемости запасов (А6) и оборачиваемости кредиторской задолженности (A5).

Построим диаграмму состояний предприятий (Рисунок 3.12).

Таким образом, предприятия первого кластера можно характеризовать как 'кризисные'. К ним относятся: ОАО 'Агроинвестсоюз' 2009, ОАО 'Агроинвестсоюз' 2010, ОАО 'Агроинвестсоюз' 2011, ОАО 'Нефтегеофизприбор 'Седин-Инструмент' 2009, ОАО 'Нефтегеофизприбор 'Седин-Инструмент' 2010, ОАО 'Нефтегеофизприбор 'Седин-Инструмент' 2011, ОАО 'Имени Карла Маркса' 2009, ОАО 'Югмонтажстрой' 2010, ОАО 'Югмонтажстрой' 2011, ОАО 'Керамик' 2009, ОАО 'Керамик' 2010, ОАО 'Керамик' 2011, ОАО 'Металлист' 2009, ОАО 'Металлист' 2010, ОАО 'Металлист' 2011 и ОАО 'Сафьян' 2010.

Ко второму кластеру относятся следующие предприятия: OAO 'Ахтырский хлебозавод' 2010, OAO 'Ахтырский хлебозавод' 2011, ОАО 'Сафьян' 2009, ОАО 'Сафьян' 2011, ОАО 'Проектный институт 'Анапагражданпроект' 2010, ОАО 'Проектный институт 'Анапагражданпроект' 2011, ОАО 'Югмонтажстрой' 2009 и OAO 'Ахтырский хлебозавод' 2009.

К третьему кластеру 'предкризисных предприятий' относятся: ОАО 'Имени Карла Маркса' 2010, ОАО 'Имени Карла Маркса' 2011, ОАО 'Армавирское полиграфпредприятие' 2009, ОАО 'Армавирское полиграфпредприятие' 2010, ОАО 'Армавирское полиграфпредприятие' 2011, ОАО 'Проектный институт 'Анапагражданпроект' 2009.

В 36,7% случаев правильно отнесены предприятия к одному из трех кластеров.

Из-за того, что показатели не нормированы невозможно визуально оценить кластеризацию предприятий и возможны ошибки в оценивании состояния предприятий, поэтому далее необходимо произвести преобразования исходных данных.

Суть метода нормирования исходных данных заключается в том, что исходными данными являются совершенно разнородные величины и результаты кластеризации не должны зависеть от единиц измерения этих величин. Поэтому все исходные данные должны быть приведены к единому масштабу. Масштабирование желательно, чтобы привести данные в допустимый диапазон.

Воспользуемся следующим способом нормирования:

,

,

тогда .

После такого преобразования каждый коэффициент нормируется так, что все значения лежат в диапазоне от - 1 до 1. При этом истинные значения утрачиваются (Рисунок 3.13).

Проведем аналогичный дивизивный анализ уже для нормированных данных методом k-средних. Результаты кластеризации исходных данных предприятий представлены на рисунках 3.14-3.15.

Из рисунка 3.14 можно сделать вывод, что практически все финансовые показатели информативны для процесса кластеризации, кроме быстрого коэффициента ликвидности (L1^), коэффициента абсолютной ликвидности (L3^), текущего коэффициента ликвидности (P1^), оборачиваемости кредиторской задолженности (A5^) и оборачиваемости запасов (A6^). Их можно исключить из процедуры кластеризации.

Из рисунка 3.15 видно, что значения показателей существенно не отличаются.

Средние значения для каждого кластера приведены на рисунке 3.16.

Из рисунка видно, что средние значения отличаются между собой, за исключением коэффициента автономии собственных средств (F1^), оборачиваемости кредиторской задолженности (A5^) и общей рентабельности (R1^). Исключим эти коэффициенты для улучшения кластеризации и облегчения интерпретации состояния предприятия (Рисунок 3.17).

Построим таблицы распределения предприятий по кластерам (Рисунок 3.18). Анализируя данные в таблицах, получаем следующую оценку состояния предприятий.

Ко второму кластеру (предкризисные) относятся предприятия: OAO 'Ахтырский хлебозавод' 2010, OAO 'Ахтырский хлебозавод' 2011, ОАО 'Югмонтажстрой' 2009, ОАО 'Керамик'2009, ОАО 'Керамик'2010 и ОАО 'Сафьян' 2010.

К третьему кластеру (кризисные) относятся предприятия: ОАО 'Агроинвестсоюз' 2009, ОАО 'Имени Карла Маркса' 2010, ОАО 'Имени Карла Маркса' 2011, ОАО 'Югмонтажстрой' 2010, ОАО 'Югмонтажстрой' 2011, ОАО 'Нефтегеофизприбор 'Седин-Инструмент' 2009, ОАО 'Нефтегеофизприбор 'Седин-Инструмент' 2010, ОАО 'Нефтегеофизприбор 'Седин-Инструмент' 2011.

Остальные предприятия относятся к певому кластеру (некризисные).

Теперь также проведем кластеризацию агломеративным методом древовидной кластеризации. Рассмотрим горизонтальную иерархическую древовидную диаграмму (рисунки 3.19-3.20). В начале вершины диаграммы расположены наиболее схожие признаки, они и образуют первый кластер: быстрый коэффициент ликвидности (L1^) и абсолютный коэффициент ликвидности (L3^). Оба этих показателей аналогичны, имеют одинаковый диапозон значений, средние и характеризуют ликвидность предприятия. Второй кластер образуют: обеспеченность запасов собственными оборотными средствами (F3^) и оборачиваемость запасов (A6^). Третий кластер образуют: оборачиваемость активов (А2^) и оборачиваемость дебеторской задолженности (А4^). Четвертый кластер образуют два коэффициента: рентабельность собственного капитала (R3^) и рентабельность продукции (продаж) (R4^). Пятый кластер образуют коэффициент автономии собственных средств (F1^) и индекс постоянного актива (F4^).

Построим диаграмму состояний предприятий для нормированных данных (Рисунок 3.21).

Таким образом, предприятия первого кластера можно характеризовать как 'кризисные'. К ним относятся: ОАО 'Агроинвестсоюз' 2009, OAO 'Ахтырский хлебозавод' 2010, OAO 'Ахтырский хлебозавод' 2011, ОАО 'Нефтегеофизприбор 'Седин-Инструмент' 2009, ОАО 'Нефтегеофизприбор 'Седин-Инструмент' 2010, ОАО 'Нефтегеофизприбор 'Седин-Инструмент' 2011, ОАО 'Югмонтажстрой' 2010, ОАО 'Югмонтажстрой' 2011, ОАО 'Керамик' 2009, ОАО 'Керамик' 2010 и ОАО 'Сафьян' 2010.

Ко второму кластеру 'нормальные' относятся следующие предприятия: ОАО 'Металлист' 2009, ОАО 'Металлист' 2010, ОАО 'Металлист' 2011, ОАО 'Армавирское полиграфпредприятие' 2009, ОАО 'Армавирское полиграфпредприятие' 2010, ОАО 'Армавирское полиграфпредприятие' 2011, ОАО 'Сафьян' 2011.

К третьему кластеру 'предкризисных предприятий' относятся: ОАО 'Агроинвестсоюз' 2010, ОАО 'Агроинвестсоюз' 2011, ОАО 'Имени Карла Маркса' 2009, ОАО 'Имени Карла Маркса' 2010, ОАО 'Имени Карла Маркса' 2011, ОАО 'Керамик' 2011, ОАО 'Проектный институт 'Анапагражданпроект' 2009, ОАО 'Проектный институт 'Анапагражданпроект' 2010, ОАО 'Проектный институт 'Анапагражданпроект' 2011, ОАО 'Югмонтажстрой' 2009 и OAO 'Ахтырский хлебозавод' 2009 и ОАО 'Сафьян' 2009.

Предприятия в 56,6% случаев правильно отнесены к одному из трех кластеров.

3.2 Нечеткая кластеризация финансового состояния предприятий

Для решения задачи оценки финансово-экономического состояния предприятия методом нечеткой кластеризации в системе MATLAB используем алгоритм нечетких c-средних (FCM).

Алгоритм FCM по своему характеру относится к приближенным алгоритмам поиска экстремума для целевой функции при наличии ограничений. Поэтому в результате выполнения данного алгоритма определяется локально-оптимальное нечеткое разбиение, которое описывается совокупностью функций принадлежности, а также центры или типичные представители каждого из нечетких кластеров.

На основе этого алгоритма будем использовать специальный графический интерфейс кластеризации. В командной строке вызовем функцию findcluster. В загрузившееся диалоговое окно загрузим нормированные данные предприятий по основным показателям (Рисунок 3.22).

В качестве метода нечеткой кластеризации выберем FCM, число кластеров равное 2, максимальное количество итераций - 100. После нажатия на кнопку Start начинается работа соответствующего алгоритма нечеткой кластеризации с заданными параметрами или по умолчанию.

Результат решения задачи нечеткой кластеризации для 2-х нечетких кластеров визуализирован на рисунке 3.23.

Эти кластеры будем рассматривать как эталонные кризисное и некризисное предприятия (Рисунок 3.24). Чем ближе предприятие к одному из кластеров, тем с большим основанием оно может быть отнесено к данному кластеру.

Из рисунка видно, что эталонные кризисноые и некризисные предприятия хорошо отличаются за исключением индекса постоянного актива (F4^) и коэффициента автономии собственных средств (F1^). F1^ и F4^ - инверсные показатели, т.е. чем значение больше, тем состояние предприятия ближе к кризисному, следовательно, они мешают визуально оценить кластеры кризисных и некризисных предприятий. Если исключить эти показатели из рассмотрения, то эталонные кризисные и некризисные предприятия достаточно хорошо отличимы друг от друга (Рисунок 3.25).

Предприятия в 80% случаев правильно отнесены к одному из двух кластеров.

Построим графики финансового поведения некоторых предприятий. (Рисунок 3.26). ОАО 'Нефтегеофизприбор 'Седин-Инструмент'' относится к кризисным предприятиям, ОАО 'Югмонтажстрой' в 2009 году имеет предкризисное состояние, а в 2010 и 2011 годах состояние ухудшается. ОАО 'Сафьян' за 2009 год имеет нормальное состояние, в 2010 году ухудшается, а в 2011 году восстанавливает свое состояние.

Используем метод субтрактивной нечеткой кластеризации для определения количества нечетких кластеров. Для этого используем функцию subtractiv (Рисунок 3.27).

Идея метода субтрактивной кластеризации состоит в том, что каждая точка данных предполагается в качестве центра потенциальноrо кластера, после чеrо следует вычислить некоторую меру способности каждой точки данных представлять центр кластера. Эта количественная мера основана на оценке плотности точек данных вокруг соответствующеrо центра кластера [6].

Таким образом, данный метод разбил область на 3 кластера. Их можно интерпретировать как 'кризисные', 'предкризисные' и 'нормальные'. Такое разбиение на кластеры более тонко характеризует финансовое состояние предприятий, чем на два кластера некризисных и кризисных.

Достоинства графического метода FСМ и subtractiv от кластерного анализа:

- простота и быстрота использования;

- нечеткость при определении объекта в кластер, что позволяет определять объекты, которые находятся на границе, в кластеры.

3.3 Классификация предприятий многослойным персептроном

Нейронная сеть является эффективным инструментом в задачах классификации, так как она генерирует бесконечное число нелинейных регрессионных моделей.

Для анализа оценки финансово-экономического состояния предприятия с помощью нейронной сети используем пакет STATISTICA Neural Networks. Загрузим нормированные данные предприятий по основным показателям, принадлежащих классам кризисных, предкризисных и нормальных предприятий.

Весь набор данных поделен на три части: обучающее множество (14 предприятий, помечены черным), контрольное множество (14 предприятий, помечены красным) и тестируемое множество (2 предприятия (кризисное и нормальное), помечены синим) (Рисунок 3.28).

Построим сеть с помощью многослойного персептрона (Multilayer Perceptron) (Рисунок 3.29).

Число слоев в сети равно 3, промежуточный слой содержит 9 элементов.

Входящих переменных 15 (L1^, L3^, P1^, F1^, F2^, F3^, F4^, A2^, A4^, A5^, A6^, R1^, R2^, R3^, R4^) и одна выходящая переменная с тремя состояниями (кризисное, предкризисное, нормальное) (Рисунок 3.30).

Для обучения сети воспользуемся следующими методами:

1. Метод спуска по сопряженным градиентам - алгоритм обучения, довольно быстрый и не требует выбора значения параметров скорости обучения и инерции, количество эпох - 50 (Рисунок 3.31).

2. Метод обратного распространения. Для этого метода были взяты следующие значения: число эпох равным 50, скорость обучения равна 0,1 и инерция - 0,3 (Рисунок 3.32).

3. Квазиньютоновский метод довольно быстрый и как метод спуска по сопряженным градиентам не требует параметров скорости обучения и инерции, количество эпох - 50 (Рисунок 3.33).

Самым точным является метод спуска по сопряженным градиентам, сеть обучена точнее, чем с использованием других методов и общие ошибки минимальны.

С помощью окна прогона набора данных (Рисунок 3.34) получаем окончательную тестируемую и контрольную ошибку, а также ошибку на тестовом множестве.

Показано фактическое финансовое состояние, целевое финансовое состояние, определенное сетью и ошибки классификации.

Построение сети с помощью многослойного персептрона методом спуска по сопряженным градиентам показала наилучший результат, но в некоторых случаях дала ошибку (Рисунок 3.35).

Однако, эти ошибки не столь существенны, так как граница, например между 'нормальным' и 'предкризисным' предприятием, слишком мала. Но эта сеть точно разделяет 'кризисное' и 'некризисное' предприятие.

3.4 Нейросетевая кластеризация сетями Кохонена состояния предприятий

Сети Кохонена главным образом рассчитаны на неуправляемое обучение. Сеть Кохонена может распознавать кластеры в данных, а также устанавливать близость классов.

Для визуализации данных о состояниях предприятий построим сеть с помощью сетей Кохонена (Рисунок 3.35). В сетях Кохонена происходит неуправляемое обучение (без учителя): сеть учится распознавать кластеры среди неразмеченных обучающих данных, содержащих только входные значения.

Используем тот же набор данных (Рисунок 3.28).

Число слоев в сети равно двум: входной и выходной слой - топологическая карта размером 15x15 (Рисунок 3.36).

Для обучения сети Кохонена воспользуемся значениями основных параметров:

- Два этапа по 50 эпох, что позволяет получить достаточную эффективность.

- На первом этапе зададим скорость обучения и размер окрестности равными 1 (Рисунок 3.37).

- На втором этапе и скорость обучения, и размер окрестности равными 0,1 (Рисунок 3.38).

Сеть Кохонена показала наименьшие ошибки (Рисунок 3.39), чем сеть, построенная с помощью многослойного персептрона.

После того, как зафиксировано распределение центров кластеров можно, протестировать сеть с целью выяснить смысла кластеров с помощью топологической карты. Топологическая карта позволяет также представить полученную информацию в простой и наглядной форме (Рисунок 3.40 а, б).

Анализ полученного рисунка позволяет увидеть, как расположены объекты в пространстве, причем легко заметить участки, где объекты группируются (сгущения). Распределение объектов таким образом означает, что у них схожи параметры, значит, и сами эти объекты принадлежат одной группе. Предприятия классифицированы на состояния: кризисное, предкризисное и нормальное.

Нелинейная структура нейронных сетей позволяет эффективно оценивать состояния предприятия в тех случаях, когда линейные модели дают ошибочный результат.

3.5 Сопоставительный анализ разработанных моделей

Проведем сопоставительный анализ результатов исследований кластерным методом, нечеткой кластеризации и нейронной сетью. Для этих моделей использовали 10 предприятий за разные годы (30 выборок) по 15 показателям.

Для сопоставительного анализа добавим к ним три виртуальных предприятия (A, B, C) (33 выборки) с заранее известными состояниями: 'кризисное', 'предкризисное' и 'нормальное' (Рисунок 3.41).

Используя многомерный кластерный анализ построим таблицы распределения предприятий по кластерам (Рисунок 3.42).

Анализируя данные в таблицах, получаем следующую оценку состояния предприятий.

К первому кластеру (нормальные) относятся предприятия: ОАО 'Агроинвестсоюз' 2010, ОАО 'Агроинвестсоюз' 2011, OAO 'Ахтырский хлебозавод' 2009, ОАО 'Проектный институт 'Анапагражданпроект' 2009, ОАО 'Проектный институт 'Анапагражданпроект' 2010, ОАО 'Проектный институт 'Анапагражданпроект' 2011, ОАО 'Керамик' 2011, ОАО 'Металлист' 2009, ОАО 'Металлист' 2010, ОАО 'Металлист' 2011, ОАО 'Сафьян' 2009, ОАО 'Сафьян' 2011 и Предприятие А.

Ко второму кластеру (предкризисные) относятся предприятия: OAO 'Ахтырский хлебозавод' 2010, ОАО 'Имени Карла Маркса' 2009, ОАО 'Имени Карла Маркса' 2010, ОАО 'Имени Карла Маркса' 2011, ОАО 'Армавирское полиграфпредприятие' 2009, ОАО 'Армавирское полиграфпредприятие' 2010, ОАО 'Армавирское полиграфпредприятие' 2011, ОАО 'Сафьян' 2010 и Предприятие С.

К третьему кластеру (кризисные) относятся предприятия: ОАО 'Агроинвестсоюз' 2009, OAO 'Ахтырский хлебозавод' 2011, ОАО 'Югмонтажстрой' 2009, ОАО 'Югмонтажстрой' 2010, ОАО 'Югмонтажстрой' 2011, ОАО 'Керамик'2009, ОАО 'Керамик'2010, ОАО 'Нефтегеофизприбор 'Седин-Инструмент' 2009, ОАО 'Нефтегеофизприбор 'Седин-Инструмент' 2010, ОАО 'Нефтегеофизприбор 'Седин-Инструмент' 2011 и Предприятие B.

Таким образом многомерный кластерный анализ дал верный результат и правильно определил состояния предприятий А, В, С.

Используя метод нечеткой кластеризации в системе MATLAB, распределим предприятия на три кластера (Рисунок 3.43).

Эти кластеры будем рассматривать как эталонные кризисное, предкризисное или некризисное предприятия (Рисунок 3.44). Из рисунка видно, что эталонные кризисные, предкризисные и некризисные предприятия хорошо отличаются за исключением индекса постоянного актива (F4^), коэффициента автономии собственных средств (F1^), оборачиваемости запасов (A2^), оборачиваемости дебиторской задолженности (A4^) и оборачиваемости кредиторской задолженности (A5^). Так как F1^ и F4^ - инверсные показатели, исключим их из рассмотрения. По графику видно, что эталонное некризисное и эталонное предкризисное состояния имеют похожие значения (Рисунок 3.45).

Построим график финансового поведения предприятий А, В и С (Рисунок 3.46). Анализируя график легко можно определить, что Предприятие B относится к классу 'кризисных', Предприятие C - 'предкризисных', а Предприятие А к классу 'некризисных' предприятий.

Метод нечеткой кластеризации в системе MATLAB неверно определила состояние предприятия С (отнесла к кризисным предприятиям).

Для новой выборки построим многослойный персептрон и с помощью метода спуска по сопряженным градиентам обучим сеть (Рисунок 3.47).

С помощью окна прогона набора данных (Рисунок 3.48) получаем окончательную тестируемую и контрольную ошибку, а также ошибку на тестовом множестве.

Показано фактическое финансовое состояние, целевое финансовое состояние, определенное сетью и ошибки классификации.

С помоью этой модели состояние предприятий А, В и С определенно верно.

Сопоставим результаты исследований проведенных с помощью статистической модели (метод кластерного анализа), нечеткой кластеризации и нейронной сети общего состояния предприятий (Рисунок 3.49-3.50).

Как видно из таблицы многомерный кластерный анализ дал неверный результат в 12 выборках из 33, то есть в 63,6% случаях, что говорит о не очень хорошем результате.

Это объясняется тем, что граница между 'кризисным' и 'предкризисным' или 'предкризисным' и 'некризисным' предприятием слишком мала. Этот метод даст лучший результат, разбив предприятия на 'кризисное' и 'некризисное'.

Нейронная сеть безошибочно относит предприятие в 90,9% случаев к одному из трех кластеров, и только в трех случаях не определила состояние предприятия. Нелинейная структура нейронных сетей позволяет эффективно оценивать состояние предприятий, где линейные модели дают ошибочные результаты.

Метод нечеткой кластеризации в системе MATLAB дал неверный результат в 16 случаях, что говорит о не очень хорошем результате (51,5%).

Таким образом, для наилучшего результата финансовой оценки предприятия необходимо комплексно использовать данные модели.

3.6 Построение динамической модели

Начало кризиса в 2008 году по большому счету российской экономикой не было в полной мере прочувствовано, основной пик пришелся на 2009 год. Уже в 2010 году начался восстановительный рост, который, однако, смог лишь компенсировать потери, но не перешагнуть через итоги 2008 года [13].

Динамику своего финансового состояния за 2011 год предприниматели оценили умеренно позитивно. Около 35% руководителей оценили изменения как положительные. Чуть большее число предпринимателей (36%) отметили, что не испытали значимых изменений, остальные 29% заявили, что финансовая устойчивость их компаний по итогам 2011 года снизилась.

Изменение финансового состояния в 2011 году по сравнению с 2010г, руководители предприятий оценили в целом нейтрально. Подавляющее число предпринимателей (36%) оценивает 'самочувствие' своих компаний как 'среднее'. Положительно охарактеризовали изменение предприятий 35%. Остальные 29% считают, что состояние ухудшилось (Рисунок 3.51).

Предприниматели, которые заявляют, что их компании являются инновационно-активными, склонны более оптимистично оценивать финансовое состояние своих предприятий.

Выше было показано, что финансово-экономическое состояние предприятий можно разделить на 3 кластера по показателю состояния: некризисные предприятия, предкризисные предприятия и кризисные предприятия.

Для того чтобы исследовать динамику изменения размеров кластеров в зависимости от различных предпринимаемых мер по улучшению состояния предприятия построим математическую модель изменения размеров кластеров в виде системы обыкновенных дифференциальных уравнений, которая формулируется при следующем предположении деления совокупности предприятий (92 объекта) на 3 группы: N - число предприятий с некризисным финансовым состоянием; S - число предприятий с предкризисным финансовым состоянием; C - число предприятий с кризисным финансовым состоянием.

Пусть INS, ISN, ISC, ICS, ICN - потоки, т.е. число переходящих предприятий из одной группы в другие.

Рассмотрим подробнее эти потоки:

1) Поток C>N. В группе C находятся предприятия с кризисным состоянием. Но предприятие может резко восстановить своё состояние, например, получив большой кредит, и попасть в группу N.

2) Потоки N>S, S>C. Главной причиной этих потоков может быть снижение спроса на продукцию, последствия кризиса или избыточная налоговая нагрузка.

Дополнительными факторами являются рост издержек и инфляция, институциональные проблемы (коррупция, бюрократия), недостаточная организованность работников, непривлечение долгосрочных кредитов и займов и т.д.

Еще одной причиной является неудовлетворительное использование предприятием внешних заемных средств, то есть нежелание или неумение пользования заемными средствами администрацией для деятельности компании. Так же недостаточно добросовестное отношения работников к служебным обязанностям и ряд других причин субъективного характера.

3) Потоки S>N, C>S. Основной причиной этих потоков является снижение административных барьеров, снижение налогов и увеличение объемов финансовой поддержки со стороны государства. Привлечение инвестиций так же может стать причиной улучшения состояния предприятия. В качестве основного источника финансирования инвестиций предприниматели рассматривают собственные средства. Вторым по частоте использования источником является банковское кредитование.

Дополнительными факторами являются:

- создание структуры управления, при которой в основе права принятия решений лежит компетентность, а не занятие официального поста;

- формирование и реализация программы систематического обучения подготовки кадров в целях более полного раскрытия их возможностей;

- обеспечение эффективной рекламы всех услуг предприятия;

- активная коммерческая деятельность (например, сдача в аренду пустующих помещений и территорий);

- проведение маркетингового анализа по изучению спроса и предложения, рынков сбыта и формирования на этой основе оптимального ассортимента и структуры производства продукции, поиск новых поставщиков и т.д.

На рисунке 3.52 показана диаграмма движения потоков.

Динамика изменения финансово-экономического состояния предприятий за 2009 - 2012 гг. представлена на рисунке 3.53.

Будем предполагать, что поток, исходящий из текущего кластера пропорционален размерности этого кластера и составим дифференциальное уравнение динамики кластера N:

(3.1)

Аналогично, составлены дифференциальные уравнения для других кластеров, в результате получена система дифференциальных уравнений для трех групп.

(3.2)

бi, вi, гi > 0.

Коэффициенты бi, вi, гi, являющиеся в общем случае функциями времени, имеют следующий смысл:

б1 - коэффициент, характеризующий переход из N в S. Показывает на сколько процентов уменьшается число некризисных предприятий за фиксированное время за счет того, что часть некризисных предприятий переходят в категорию предприятий с предкризисным состоянием, б2 - коэффициент, характеризующий переход из S в C, в1 - коэффициент, характеризующий переход из S в N, г1 - коэффициент, характеризующий переход из C в N, г2 - коэффициент, характеризующий переход из C в S. Определяются аналогично б1 с учетом состояний перехода.

Предположим D - общее число исследуемых предприятий и это число не меняется. Следовательно:

D = N + S + C = const (3.3)

От численного абсолютного показателя перейдем к относительным показателям (долям), для этого, поделим уравнения на D, получим:

(3.4)

Обозначим - доли арбитражных судов в общем количестве, тогда

(3.5)

Перейдем во всех уравнениях к относительным величинам. Для простоты записи в дальнейшем знак '~' опускается.

В данной системе уравнений (3.2) выразим С: C = D - N - S, тогда подставим это соотношение в систему уравнений, получим следующую систему (3.6):

(3.6)

К системе уравнений (3.6) нужно добавить начальные условия:

N (0) = N0, S (0) = S0 (3.7)

Т.о. для нахождения функции N (t) и S (t) получим задачу Коши (3.6) и (3.7).

Значения функций б1, б2, в1, г1, г2 и их графики за 2009-2011 гг. изображены в таблице 3.1 и на рисунке 3.54

Таблица 3.1 - Показатели коэффициентов чувствительности 2009-2011 гг.

2009-2010

2010-2011

2011-2012

б1

0,00000

0,16667

0,166667

б2

0,11111

0,14286

0,375

в1

0,22222

0,00000

0,375

г1

0,00000

0,10000

0

г2

0,10000

0, 20000

0,444444

Рисунок 3.54 показывает потоки перехода из одних кластеров в другие в данный момент времени.

Для численного решения задачи Коши (3.6) и (3.7) перейдем от системы дифференциальных уравнений к системе разностных уравнений:

(3.8)

i = 0, 1, 2…

где

Ni = N (ti)

Ni, Si, б1i, б2i, в1i, г1i, г2i означают значение соответствующих функций в точках ti.

Используя соотношение (3.8), находим Ni, Si, Ci, график которых изображен на рисунке 3.55.

Построим график (Рисунок 3.55):

К 2012 году предприятия постепенно восстанавливают своё положение.

Если усреднить б1, б2, в1, г1, г2 и считать их постоянными, то функции N (t) и S (t) могут быть найдены решением задачи Коши (3.7) и (3.8).

Действительно, положим б1 = 0,111, б2 = 0,210, в1 = 0, 199, г1 = 0,033,г2 = 0,248, то получим систему линейных дифференциальных уравнений:

(3.9)

Эта система уравнений имеет точку покоя Nпокоя = 0,536, Sпокоя = 0,266, Спокоя = 0, 198, т.к. собственные числа системы являются отрицательными, причем N (t) > Nпокоя, S (t) > Sпокоя, C (t) > Cпокоя, при t>?. Т.о. происходит стабилизация долей предприятий с различным состоянием.

Графики полученных функций N (t), S (t) и C (t) приведены на рисунке 3.56.

Из рисунка 3.56 видно, что происходит стабилизация долей предприятий с некризисным состоянием на 53,6%, с предкризисным состоянием на 26,6% и с кризисным состоянием на 19,8%. Стабилизация может происходить на разных уровнях.

Заключение

В дипломной работе были проведены современные методы кластерного анализа, такие как многомерный статистический кластерный анализ, нечеткая кластеризация, нейросетевая кластеризация сетями Кохонена и классификация многослойным персептроном для анализа финансово-экономической оценки состояния предприятий. В последствии была разработана динамическая модель кластеризации финансово-экономического состояния предприятия. Тем самым достигнута поставленная цель дипломной работы.

Решены следующие задачи:

а) был проведен кластерный анализ предприятий по исходным и нормированным данным по 15 показателям, что позволило выявить их финансово-экономическое состояние;

б) был проведен анализ с помощью нечеткой продукционной системы MatLab на основе графического интерфейса fuzzyTECH, которая позволяет проводить оценку состояния предприятия для двух и более кластеров;

в) разработана архитектура нейронной сети с помощью многослойного персептрона, созданная для оценки состояния предприятия, а так же для прогнозирования финансово-экономического состояния предприятий. Проведено обучение этой сети различными методами;

г) с помощью пакета STATISTICA Neural Networks была построена нейронная сеть Кохонена;

д) был проведен сопоставительный анализ результатов исследований проведенных с помощью статистической модели (метод кластерного анализа), нечеткой кластеризации и нейронной сети общего состояния предприятий.

е) была построена динамическая модель изменения финансово-экономического состояния предприятия.

Таким образом, при исследовании состояния предприятия кластерная модель не дает для отдельно взятого предприятия полную адекватную оценку его состояния, так как не является репрезентативной и её необходимо дополнять нейросетевыми моделями оценки и нечёткими продукционными системами. Такая группа методов уже является репрезентативной. Поэтому для наилучшего результата финансовой оценки предприятия необходимо комплексно использовать данные модели.

С помощью динамической модели показано, что если потоки из одного кластера в другой постоянны, то происходит стабилизация долей предприятий с различным состоянием. Стабилизация может происходить на разных уровнях.

Список использованных источников

1. Барский А.Б. Нейронные сети: Распознавание, управление, принятие решений. Финансы и статистика, 2007 г. - 175 с.

2. Боровиков В.П. Нейронные сети. STATISTICA Neural Networks: Методология и технологии современного анализа данных. Горячая Линия-Телеком, 2008. - 392 с.

3. Быкадоров В.Л., Алексеев П.Д. Финансово-экономическое состояние предприятия: Практическое пособие. - М.: ”Издательство ПРИОР”, 2000. - 96 с.

4. Жарковская, Е.П. Антикризисное управление: учеб. / Е.П. Жарковская, Б.Е. Бродский. - 2-е изд., испр. и доп. - М.: Омега-Л, 2005. - 357 с.

5. Коваленко А.В. Многомерный статистический анализ предприятия: монография / Уртенов М.Х., Узденов У.А., М.: ACADEMIA, 2009. - 240с.

6. Леоненков А.В. Нечеткое моделирование в среде MATLAB и fuzzyTECH. Санкт-Петербург: БХВ-Петербург, 2005. - 736 с.

7. Недосекин А.О. Сводный финансовый анализ российских предприятий за 2000-2003 гг. Аудит и финансовый анализ, 2005.

8. Пястолов С.М. Экономический анализ деятельности предприятий. Учебное пособие. - М.: Академический Проект, 2003. - 572 с.

9. Фомин, Я.А. Диагностика кризисного состояния предприятия / Я.А. Фомин. - М.: Юнити-Дана. 2003. - 349 с.

10. Хайкин С. Нейронные сети: полный курс, 2-е издание. Вильямс, 2008 г. - 1104 с.

11. Халафян А.А. STATISTICA 6. Статистический анализ данных. Москва: Бином-Пресс, 2008. - 512 с.

12. Шмален Г. Основы и проблемы экономики предприятия: Пер. с нем. / Под ред. проф. А.Г. Поршнева. - М.: Финансы и статистика, 2004. - 512 с.

13. Российский Банк поддержки малого и среднего предпринимательства. - (Рус). - URL: http://mspbank.ru (дата обращения: 10.05.2013).

14. Сервер раскрытия информации. - (Рус). - URL: http://www.e-disclosure.ru (дата обращения: 20.05.2013).

ref.by 2006—2025
contextus@mail.ru