2
1
АННОТАЦИЯ
Данный документ представляет собой пояснительную записку к дипломному проекту на тему «Автоматизированная система статистического анализа прогнозирования параметров технологического процесса производства», где отражены все основные этапы проектирования автоматизированной системы.
Система предназначена для более глубокого контроля технологического процесса, и тем самым получения максимально приближенной к заданному качеству продукции и снижения процента брака.
автоматизированная система технологический производство
ВВЕДЕНИЕ
Вопрос качества выпускаемой продукции всегда являлся одним из основных вопросов промышленного производства. Удовлетворение постоянно растущего спроса на высококачественную продукцию возможно только на базе эффективного контроля и анализа качества готовой продукции.
Для повышения качества продукции необходимо постоянно совершенствовать технологию производства, что обеспечивается за счет внедрения автоматизированных систем сбора и обработки информации, анализа технологии и гибкого управления. Оснащение заводов современной вычислительной техникой и использование автоматизированных систем, создает условия для повышения качества готовой продукции. Для решения данной задачи необходимо разработать систему, позволяющую анализировать технологические этапы производства с целью получения требуемых свойств с максимальной вероятностью.
Внедрение подобного проекта в действующее производство позволит значительно понизить процент забракованной продукции, улучшить ее качество за счет повышения качества управления производством.
1. Литературный и патентный обзор постановки подобных задач. Анализ аналогичных систем
Целью проекта является создание автоматизированной системы анализа технологических параметров производства продукции. В настоящее время существует большое количество коммерческих систем решающих эту задачу.
Одной из таких систем является система Stata 7 - универсальный статистический пакет со специализацией в областях эконометрики, биометрики, анализе стратифицированных обследований. Предназначен для студентов, аспирантов, исследователей в прикладных областях, интенсивно пользующихся статистикой в своей работе.
Достоинства пакета
Программа Stata - это универсальный пакет для решения статистических задач в самых разных прикладных областях: экономике, медицине, биологии, социологии. Впервые пакет вышел на рынок под этим названием в начале 80-х гг. В январе 1999 г. была выпущена шестая версия, в декабре 2000 г. - седьмая. Основными достоинствами Stata являются:
· большой спектр реализованных статистических методов; возможности гибкой пакетной обработки данных (т. е. программирования всей последовательности команд, начиная от загрузки данных в память до всех деталей анализа);
· возможности интерактивного режима работы полностью идентичны возможностям пакетной обработки;
· относительная простота написания собственных программных модулей, и, вместе с тем, весьма серьезный спектр средств программирования;
· мощная поддержка как со стороны производителя, так и со стороны других пользователей Stata (через интернетовский список рассылки); огромный архив пользовательских программ в открытом доступе;
· возможность максимизации функций правдоподобия, задаваемых пользователем;
· наличие совместимых по функциональным возможностям и форматам данных реализаций для большинства популярных платформ (Windows, Macintosh, UNIX).
По поводу графических средств мнения пользователей разнятся: с одной стороны, они вполне достаточны для текущего графического анализа данных и подготовки научных публикаций, с другой, несравнимы с графическими возможностями специализированных пакетов типа Harvard Graphics или презентационных программ типа PowerPoint.
Возможности пакета
· Базовые статистические методы описательные статистики, таблицы сопряженности, корреляции, t-тесты, тесты на равенство дисперсий, тесты на пропорции, ...
· Линейные модели дисперсионный анализ, линейная регрессия, оценка ковариационной матрицы в форме Хьюбера-Уайта, метод инструментальных переменных, трехшаговый МНК, внешне не связанные регрессии, регрессии с ограничениями, квантильные регрессии, обобщенный МНК.
· Обобщенные линейные модели Гауссовская, биномиальная, Пуассоновская, отрицательная биномиальная, гамма, логит, пробит, степенная модели, модель дополнительных логарифмов.
· Модели с бинарными и ограниченными зависимыми переменными логит, пробит, тобит-модели, регрессия с цензурированием, условно-логистическая регрессия, полиномиальная, вложенная логит-модели, пуассон-регрессия, отрицательно-биномиальная модель, модели с увеличенной пропорцией нулей, модель Хекмана, модель обработки, предельные эффекты.
· Панельные/повторные данные обобщенные уравнения оценивания, регрессии со случайными и фиксированными эффектами, модели пробит и тобит со случайными эффектами, модели Пуассона и отрицательная биномиальная со случайными и фиксированными эффектами, оценка Ареллано-Бонда, регрессия с инструментальными переменными, регрессия с автокоррелированными ошибками, ...
· Непараметрические методы статистика Уилкоксона-Манна-Уитни, знаково-ранговый тест Уилкоксона, статистика Крускала-Уоллиса, коэффициенты корреляции Спирмена и Кендалла, тест Колмогорова-Смирнова, точные биномиальные доверительные интервалы, ...
· Многомерные методы факторный анализ, метод главных компонент, канонические корреляции, многомерная регрессия.
· Кластерный анализ иерархические методы: одиночная, полная, средняя связи; методы k-средних и k-медиан, дендрограммы, два десятка метрик, расширение пользователями.
· Методы повторных выборок и статистического эксперимента бутстреп, метод складного ножа, метод Монте-Карло.
· Проверка гипотез и работа с оцененными моделямитесты Вальда, отношения правдоподобия, тесты на линейные ограничения, тесты на нелинейные ограничения, предельные эффекты, скорректированные средние, построение прогнозов, извлечение остатков, диагностика выделяющихся наблюдений, тест Хаусмана, тест множителей Лагранжа на пропущенные переменные.
· Максимизация функций правдоподобия, заданных пользователем
· Анализ обследований со сложной структурой выборки выборочные веса, стратификация, многоступенчатая кластерная структура выборки, линеаризованная оценка дисперсии, эффект дизайна, средние, пропорции, отношения, суммы, таблицы сопряженности, линейная регрессия, регрессия с инструментальными переменными, логит, пробит, полиномиальная логит-модели, ...
· Модели выбытия модели Каплана-Мейера, Нельсона-Аалена, регрессия Кокса, параметрические модели, тесты на пропорциональность рисков, регрессоры, меняющиеся со временем, цензурирование слева и справа, модели Вейбулаа, экспоненциальная, Гомперца, логнормальная.
· Средства для эпидемиологов стандартизация темпов распространения, случай-контрольная группа, когорты, совмещенный анализ случаев и контрольных групп, модель Мантеля-Хеншеля, фармакокинетика, анализ кривых ROC, использование кодов ICD-9.
· Временные ряды и модели ARIMA, ARCH/GARCH, процедуры Кохрейна-Оркутта, Прейса-Винстена, оценка Ньюи-Веста, коррелограммы, периодограммы, тесты на белый шум, на единичные корни, операторы сдвига, разности, сезонных эффектов.
· Преобразования и тесты на нормальность преобразование Бокса-Кокса, степенные преобразования, тесты Шапиро-Уилка, Шапиро-Франсии, на асимметрию и эксцесс.
· Прочие статистические процедуры и методы размер выборки и мощность тестов, нелинейная регрессия, добавление пропущенных данных, пошаговая регрессия, статистические и математические функции, ...
· Операции над данными преобразование данных, совмещение данных, обработка по группам наблюдений, присоединение файлов, сортировка, транспонирование данных, метки, работа со строками, ...
· Матричные команды матричная арифметика, обращение матриц, задача на собственные значения, сингулярное разложение, произведение Кронекера, преобразование данные-матрица.
· Язык программирования добавление команд, условные выражения, синтаксический разбор, отладка, программирование меню и диалоговых окон, язык разметки и управления.
Графика
· диаграммы рассеяния, столбцовые и круговые диаграммы, диагностика регрессий, анализ выбытия, непараметрическое сглаживание, квантильные графики.
Internet-возможности
· установка новых программ, пополнение пакета, корпоративные новости, передача файлов.
Пакет SAS
· Пакет SAS содержит командный язык SAS.
· Пакет содержит обширный набор методов от простейшей статистической обработки, до обработки многомерной информации, включая:
· регрессионный анализ (regression analysis);
· дисперсионный анализ (ANalysis Of VAriance - ANOVA);
· компонентный анализ (categorical data analysis);
· факторный анализ (multyvariate data analysis);
· дискриминантный анализ (discriminant analysis);
· кластерный анализ, например, CLUSTER - самостоятельная программа, использующая командный язык SAS, содержит 11 методов;
· проверка значимости и надежности (survival analysis);
· анализ рисков при принятии решений;
· прогнозирование с использованием: экспоненциального сглаживания, моделей линейного роста, АРИСС-модели с учетом сезонности.
· Пакет SAS содержит интегрированные средства хранения и обработки информации, генерации и настройки пользовательских приложений (с использованием встроенного языка программирования).
Анализ пакета SAS показал нерациональность его использования при решении данной задачи ввиду их высокой стоимости (>20000 долл.США). Стоимость использования этого программного пакета невозможно снизить за счет использования небольшой группы возможностей, действительно необходимых для решений данной задачи, поскольку большинство компонент пакета взаимосвязаны. Например, большое внимание в пакете SAS уделяется организации масштабных хранилищ данных, что для данной задачи - излишне.
Анализ текстов показывает, программные пакеты SAS и S-PLUS занимают лидирующие позиции на рынке специализированных средств разработки приложений для статистического анализа данных. Однако, ввиду высокой стоимости и существенной функциональной избыточности использование SAS - нерационально. Возможность использования S-PLUS подлежит дальнейшему исследованию.
Существуют и другие мощные пакеты статистического анализа [8,9,10], позволяющие выявлять достаточно сложные зависимости и получать анализ поведения реальных систем, но их недостатками являются статичность, оторванность от реального процесса, ограниченность манипуляции с моделями. Иногда даже небольшое изменение входных данных в таких системах требует повторения всего цикла предварительной подготовки и сложного процесса пересчета модели. Число одновременно используемых статистических методов также ограничено.
Чрезвычайно трудно реализовать многоэтапную подстановку и передачу данных от одного метода к другому и многократное повторение этого процесса [8,10].
В соответствии с изложенным целью данной системы анализа технологических параметров производства является создание универсальной системы анализа, обеспечивающей получение адекватной информации о ходе технологического процесса и позволяющей наиболее точно анализировать полученные результаты. Под универсальностью понимается, что система позволит работать не с конкретным, а с практически любым процессом производства [8].
2. Характеристика информационного объекта и существующей системы обработки информации
2.1 Характеристика технологического процесса
Рис. 1. Технологический процесс производства крахмала
В настоящее время практически любой технологический процесс состоит из множества этапов. Одним из таких процессов является производство крахмала (рис. 1). Крахмальное производство относят к классу непрерывно-дискретных. Это означает, что четко может быть выделено отдельное порция продукции (кукурузная кашка, крахмальная суспензия и т. д.), которая перерабатывается последовательностью технологических агрегатов. Может быть осуществлено слежение за движением каждой порции и за изменением ее физико-химических и размерных параметров на каждом этапе технологического процесса. С другой стороны большинство агрегатов работают в непрерывном процессе, в течение которого в него последовательно задаются отдельные порции сырья. Непрерывно-дискретный характер крахмального процесса требует учета его специфических особенностей в проектируемой системе анализа технологических параметров производства продукции.
Готовый продукт любого производства изготавливается и поставляется потребителям в соответствии с требованиями ГОСТ, отраслевых и межотраслевых технических условий, а также внутризаводских технических условий (стандартов предприятия), регламентирующих требования к полупродукту при передаче его из одного цеха в другой для последующего передела.
Существующие стандарты (в рамках производственного процесса) можно разделить на три основные группы: стандарты на сортамент; стандарты на сортамент и технические требования; стандарты на технические требования. Стандарты, технические условия и другие нормативные документы регламентируют способ изготовления продукции, свойства и допускаемые отклонения свойств от нормы, состав и допускаемые отклонения по составу, механические свойства.
2.2 Характеристика существующей системы обработки информации
2.2.1 Функции и методы сбора, передачи, хранения, обработки, отображения информации и управления
Функции и методы работы с информацией представляют собой как автоматизированную, так и ручную обработку. На участках в каждом цехе ведется постоянный учет и контроль за количеством и свойствами произведенной продукции, что отражается в технологических журналах: журнал сухого крахмала, журнал замочного отделения, журнал технологий и др. Эти данные накапливаются и хранятся на бумажных и машинных носителях в отделах, которые занимаются задачами сбора и обработки информации, где и формируются соответствующие отчетные документы. Организация данных и информационных потоков соответствует определенным формам, документам, заранее выработанным и утвержденным в соответствующих органах управления в зависимости от их важности и уровня представления.
2.2.2 Средства сбора, передачи, хранения, обработки, отображения информации и управления
Сбор информации с объектов осуществляется при помощи специальных датчиков. Вся информация, собранная с объекта и полученная в результате работы системы, хранится в ЭВМ в виде массивов, файлов или баз данных на жестких дисках. Хранение резервных копий информации осуществляется на жестких или гибких дисках. Выходная информация представляется в виде бумажных документов, которые заполняются статистиками отделов технического контроля с определенной периодичностью.
2.2.3 Анализ недостатков в обработке информации
Организация любого процесса производства и функционирование автоматизированных информационных систем и систем реального времени предусматривает периодический контроль за способами анализа данных с целью выявления и устранения недостатков в обработке информации. Современное производство не может обойтись без постоянного слежения за уровнем контроля ведения информационной базы непосредственно снимаемой с объектов управления информации, так как это может привести к различным негативным последствиям, например, к утрате важной информации.
Также для решения многокритериальных производственных задач существующими системами необходимо привлечение большого количества экспертов по конкретной предметной области для корректного описания объекта управления. Это приводит к возрастанию материальных и временных затрат на получение решения.
Недостатками существующих систем анализа являются статичность, оторванность от реального процесса, ограниченность манипуляции с моделями. Иногда даже небольшое изменение входных данных в таких системах требует повторения всего цикла предварительной подготовки и сложного процесса пересчета модели. Число одновременно используемых статистических методов также ограничено.
3. Постановка задачи проекта, цели, критерии и основные ограничения создания автоматизированной системы
Разрабатываемая автоматизированная система анализа технологических параметров производства продукции предназначена для более глубокого контроля технологического процесса, и тем самым получения максимально приближенной к заданному качеству продукции и снижения процента брака.
Данная подсистема проектируется в рамках интегрированной системы управления технологическим процессом, которая предусматривает решение не только задачи выбора оптимальной технологии, но и моделирование технологических процессов, их статистический анализ, определение расходных коэффициентов по видам продукции и агрегатам; расчет затрат по переделам, расчет себестоимости с учетом незавершенного производства, анализ временных характеристик производства.
Автоматизированная система должна решать задачи ввода, проверки логической целостности и корректировки вводимой информации, ее обработки, представления результатов в различных формах, удобных для восприятия и обеспечения взаимодействия пользователя с системой с использованием дружественного интерфейса.
Основными целями создания автоматизированной системы анализа технологического производства направленных на устранение выполнения рутинных операций, являются:
· Статистический анализ входных данных;
· уменьшение диапазонов технологических факторов, что позволит снизить влияние нестабильности технологии;
· выбор технологических диапазонов с максимально возможной вероятностью получения качественной продукции в рамках заданного критерия качества для вида продукции, что с максимальной вероятностью гарантирует получение низкого процента брака;
· выбор наиболее значимых факторов, непосредственно влияющих на выходные свойства;
· поэтапная корректировка технологических диапазонов в соответствии с течением реального технологического процесса с учетом колебаний состава сырья и способов его обработки.
Одним из ограничений, накладываемым на разрабатываемую автоматизированную систему, являются вычислительные ресурсы. Оно связано с обработкой достаточно большого количества информационных массивов и с особенностями реализуемых математических методов и алгоритмов. Система должна обладать временем реакции, соответствующим темпам технологического процесса, поэтому она должна использовать быстрые средства обработки информации.
4. Исследование информационного объекта. Выявление основных свойств и закономерностей
4.1 Теоретическое изучение объекта управления. Построение теоретических математических моделей
Общие сведения.
Управление и анализ являются неотъемлемыми частями любого производственного процесса. В процессе исследования и проработки основной концепцией системы анализа технологических параметров производства стало создание достаточно универсальной системы анализа технологических факторов и свойств [1].
Свойства продукции составляют большую часть регламентируемых стандартами показателей качества и находятся в сложной зависимости от факторов. Отсутствие однозначных функциональных зависимостей между факторами и свойствами готовой продукции, наличие случайных величин, влияющих на технологический процесс и продукцию в целом, привели к необходимости задания технологии в виде разрешённых интервалов для каждого фактора. Исследования показали, что уровень выходных свойств в значительной мере определяется значениями выбранных диапазонов и для получения высоких потребительских характеристик необходимо решать задачу выбора оптимальных диапазонов технологических факторов [2].
Важным этапом в построении систем управления технологии является определение глобальной и локальной технологий [3,4,5,6].
Технология производства задается указанием разрешенных диапазонов технологических величин с помощью соотношений:
где - минимально и максимально допустимые значения технологической величины, i = 1, 2, ..., I -номер этапа, на каждом из которых может контролироваться j = 1, 2, …, J технологических величин.
Задача состоит в том, чтобы определить оптимальные значения . Заданную таким образом технологию назовем глобальной..
Технологию, определяющую конкретный этап производства продукции, назовем локальной. Для того чтобы иметь возможность контролировать глобальную технологию, необходимо контролировать локальную.
Дисперсионный анализ.
В процессе наблюдения за исследуемым объектом качественные факторы произвольно или заданным образом изменяются. Конкретная реализация фактора (например, определенный температурный режим, выбранное оборудование или материал) называется уровнем фактора или способом обработки. Модель дисперсионного анализа с фиксированными (постоянными) уровнями факторов называют моделью I, модель со случайными факторами - моделью II. Благодаря варьированию фактора можно исследовать его влияние на величину отклика. В настоящее время общая теория дисперсионного анализа разработана для моделей I.
Дисперсионный анализ основан на разложении общей дисперсии (вариации) отклика на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействия. Оценив влияние факторов, дисперсионный анализ позволяет выбрать среди них наиболее важные. [11]
В зависимости от количества факторов, включенных в анализ, различают однофакторный, двухфакторный и многофакторный дисперсионный анализ. В данной системе было использовано влияние конкретного фактора на конкретное свойство используя метод однофакторного дисперсионного анализа.
Однофакторный дисперсионный анализ(ANOVA)
Методы однофакторного дисперсионного анализа предназначены для формирования статистических выводов применимо к гипотетической совокупности опытов, если совокупность данных имеет определенный вид, а выборка производится определенным образом.
Предположения:
1. результаты выбираются случайно
2. из нормальных совокупностей
3. с равными дисперсиями 2
4. различные выборки независимы
В результате формируется матрица Х (табл. 1):
Таблица 1. Разбиение исходных данных на уровни с равными n
1 группа |
2 группа |
… |
m группа |
|
X1.1 |
X1.2 |
… |
X1.m |
|
X2.1 |
X2.2 |
… |
X2.m |
|
… |
… |
… |
… |
|
Xn.1 |
Xn.2 |
… |
Xn.m |
ANOVA включает в себя 5 этапов:
1. Для объяснения данных постулируется линейная модель.
Xij=+j+eij, где 1+ 2+ 3+….+ J=0, а все eij - независимы
2. Формулируется нуль-гипотеза H0.
H0: 1=2=…=J=0 или 1=…=J (т.е фактор не влияет на свойство).
3.
4. Выбирается уровень , то есть исследователь решает, какую вероятность он присвоит отбрасыванию H0, когда она верна. Уровень обычно выбирается равным 10%, 5%, 1% или 0.1%. Значения , превышающие 10%, вероятно, допускают слишком большой риск неверного отбрасывания H0, а значения , которые меньше 0,1%, вероятно, выбраны слишком осторожно.
5. Производится вычисления сумм квадратов, степеней свободы и средних квадратов.
Сумма значений для первого уровня обозначается так:
Сумма значений, деленная на n - среднее арифметическое первой группы.
Среднее обозначается как:
=( - означает, что суммирование происходит по i)
Общее среднее:
Выборочная дисперсия первой группы:
Полная сумма квадратов:
При расчленении полной суммы квадратов необходимо связать с каждой суммой целые числа, называемые степенями свободы - выражение, заимствованное из области физических наук, где оно характеризует движение объекта. Если объект имеет возможность двигаться прямолинейно, он обладает одной степенью свободы; мяч на корте для игры в гандбол обладает тремя степенями свободы.
Для степени свободы обозначим как
Для - как
6. Рассчитывается F- отношение и сравнивается с точкой процентиля 100*(1-) в распределении FJ-1, J(N-1). Проверка нуль-гипотезы осуществляется путем сравнения отношения с величиной, полученной из F-таблицы, которая должна быть выше табличной в случае отбрасывания нуль-гипотезы.
Сумма квадратов (SS), деленная на число степеней свободы (df), называется средним квадратом (MS). В дисперсионном анализе интересны только два квадрата - средний квадрат между (MSb) и средний квадрат внутри (MSw).
Таким образом, получается важное соотношение:
SSb+SSw=SSt
dfb+dfw=dft=JN-1
Ожидание MSw подразумевается как среднее по большой выборке MSw для многих экспериментов и обозначается как E(MSw). Величина MSw не зависит от средних значений совокупностей, из которых извлекаются группы при проведении эксперимента. MSw - «свободное от среднего», отражающее изменчивость только внутри групп. Тогда MSw=2. Для MSb нельзя утверждать тоже самое, что для MSw, так как если по крайней мере две из генеральных средних различны, то E(MSb) будет превышать 2.
E(MSb)= ,
где 2 - дисперсия каждой совокупности;
N - число элементов в каждой группе; J - число групп; - генеральное среднее j-ой совокупности, - среднее J генеральных средних.
Однофакторный дисперсионный анализ (ANOVA) с неравными n
Нередко в J ячейках однофакторного дисперсионного анализа ANOVA число результатов не равно. Таким образом получается план с неравным числом наблюдений N.
Поскольку в данном случае группы могут содержать различное число значений, необходимо предусмотреть число значений первой группы n1, второй n2, …… и J-й группы - nJ. Данные собранные в плане можно представить следующим образом (табл. 2):
Таблица 2. Разбиение исходных данных на уровни с неравными n
1 группа |
2 группа |
… |
3 группа |
|
X1.1 |
X1.2 |
… |
X1.3 |
|
X2.1 |
X2.2 |
… |
X2.3 |
|
… |
X3.2 |
… |
… |
|
… |
… |
… |
|
|
… |
|
… |
||
… |
… |
|||
|
… |
Модель
Предполагается, что Xij можно представить в виде следующей линейной модели:
Xij=+j+eij
где Xij - i-ое значение j-ой группы; - среднее J средних, j - разность между средним j-ой совокупности и eij - разность между Xij и , средним j-ой совокупности.
В j-ой группе индекс i принимает значения от 1 до nj. Общее число данных во всех группах обозначим N=n1+n2+…..+nJ, n1*1+n2*2+…..+nJ*J.
Нуль-гипотеза выглядит так:
H0: j=0 для всех j.
Определяются:
1. Сумма квадратов
2. Степени свободы и средние квадраты
Степени свободы для равны N-J, для - J-1. ,
3. В случае верности нуль-гипотезы отношение будет соответствовать центральному F-распределению с J-1 и N-J степенями свободы. Принимается , определяется точка процентиля 100*(1-) по таблице F-распределения с J-1 и N-J степенями свободы, затем отношение сравнивается с табличным и принимается решение о принятии или отвержении H0, а следовательно значим ли фактор или нет (влияет ли данный фактор на данное свойство).
Факторный анализ.
В современной статистике под факторным анализом понимают совокупность методов, которые на основе реально существующих связей признаков (или объектов) позволяют выявлять латентные обобщающие характеристики организационной структуры и механизма развития изучаемых явлений и процессов.
В факторный анализ состоит из двух этапов:
· решение задачи методом главных компонент (рис. 2);
· оценка уровня информативности;
Метод главных компонент.
Рис. 2. Алгоритм метода главных компонент
Оценка уровня информативности:
Алгебраическими преобразованиями матрицы данных А выделяются значения информативности факторов.
Кластерный анализ.
Технологические режимы представляются в виде координат метрического пространства, каждый режим со своими значениями входных параметров будет отображаться в некоторую точку этого пространства. Два режима с почти одинаковыми значениями входов отображаются в две близкие точки, а режимы с сильно отличающимися входами будут представляются далекими друг от друга точками. Если имеются сгустки точек, отделенные промежутками от других сгустков, то они выделяются в отдельные структурные части множества - в «кластеры». Сходство или различие между классифицируемыми объектами устанавливается в зависимости от метрического расстояния между ними. В данном случае используется евклидово расстояние [1,2]:
,
где dij - расстояние между i-м и j-м объектами;
xij, xjl - значения i-й переменной соответственно у i-го и j-го объектов.
Методы кластерного анализа можно разделить на две большие группы: иерархический метод, включающий агломеративные (объединяющие), дивизимные (разделяющие) методы и итеративные методы (метод к-средних, FOREL, SKAT, KRAB). Каждый метод как объединяющего, так и разделяющего типа может быть реализован при помощи различных алгоритмов: метод ближнего соседа, метод дальнего соседа, метод средней связи, метод Уорда и метод Боннера. Особенность итеративных методов в том, что кластеры формируются исходя из задаваемых условий разбиения (параметров), которые в процессе работы алгоритма могут быть изменены пользователем для достижения желаемого качества разбиения[2].
Для получения сгустков, содержащих максимальное количество технологических режимов, возможно, использовать методы поиска сгущений: FOREL, KRAB [18]. Алгоритм FOREL предоставляет информацию о кластерах и точках, попавших в эти кластеры. Режимы (объекты), включенные в один таксон (кластер), попадают в гиперсферу с определенным центром С и радиусом R. Изменяя радиус, можно получать разное число таксонов K.
4.2 Экспериментальное изучение информационного объекта
Входы(факторы):
Влажность_зерна
Выборочные характеристики (рис. 4):
Математическое ожидание = 42.712;
Дисперсия эмпирического распределения = 0.238;
Дисперсия теоретического распределения = 0.242;
Коэффициент вариации = 0.006;
СК0_1 = 0.487;
СКО_2 = 0.492;
Второй центральный момент = 0.238;
Третий центральный момент = 0.035;
Четвертый центральный момент = 0.149;
Ассиметрия = 0.305;
Несмещенная оценка ассиметрии = 0.314;
S_As = 0.330; Эксцесс = -0.051;
Несмещенная оценка эксцесса = 0.069;
S_Ek = 0.650;
|As| = 0.314; 3*S_As = 0.991;
|Ek| = 0.069 5*S_Ek = 3.250
Гипотеза о нормальности распределения принимается
Рис. 4. Диаграмма интервалов для данных «Влажность зерна»
Измельченная кашка
Выборочные характеристики (рис. 5):
Математическое ожидание = 11.965;
Дисперсия эмпирического распределения = 0.674;
Дисперсия теоретического распределения = 0.687;
Коэффициент вариации = 0.057;
СК0_1 = 0.821;
СКО_2 = 0.829;
Второй центральный момент = 0.674;
Третий центральный момент = -0.230;
Четвертый центральный момент = 0.902;
Ассиметрия = -0.416;
Несмещенная оценка ассиметрии = -0.429;
S_As = 0.330;
Эксцесс = -0.354;
Несмещенная оценка эксцесса = -0.266;
S_Ek = 0.650;
|As| = 0.429; 3*S_As = 0.991;
|Ek| = 0.266; 5*S_Ek = 3.250;
Гипотеза о нормальности распределения принимается.
Рис. 5. Диаграмма интервалов для данных «Влажность зерна»
Суспензия_вещества
Выборочные характеристики (рис. 6):
Математическое ожидание = 33.012;
Дисперсия эмпирического распределения = 0.738;
Дисперсия теоретического распределения = 0.752;
Коэффициент вариации = 0.023;
СК0_1 = 0.859;
СКО_2 = 0.867;
Второй центральный момент = 0.738;
Третий центральный момент = 0.019;
Четвертый центральный момент = 1.304;
Ассиметрия = 0.030;
Несмещенная оценка ассиметрии = 0.031;
S_As = 0.330;
Эксцесс = -0.531;
Несмещенная оценка эксцесса = -0.461;
S_Ek = 0.650;
|As| = 0.031; 3*S_As = 0.991;
|Ek| = 0.461; 5*S_Ek = 3.250;
Гипотеза о нормальности распределения принимается.
Рис. 6. Диаграмма интервалов для данных «Суспензия вещества»
Кислотность
Выборочные характеристики (рис. 7):
Математическое ожидание = 11.977;
Дисперсия эмпирического распределения = 1.705;
Дисперсия теоретического распределения = 1.739;
Коэффициент вариации = 0.145;
СК0_1 = 1.306;
СКО_2 = 1.319;
Второй центральный момент = 1.705;
Третий центральный момент = 2.346;
Четвертый центральный момент = 7.702;
Ассиметрия = 1.053;
Несмещенная оценка ассиметрии = 1.085;
S_As = 0.330;
Эксцесс = -83.568;
Несмещенная оценка эксцесса = -92.073;
S_Ek = 0.650;
|As| = 1.085; 3*S_As = 0.991;
|Ek| = 92.073; 5*S_Ek = 3.250;
Гипотеза о нормальности распределения отвергается.
Рис. 7. Диаграмма интервалов для данных «Кислотность»
5. Эскиз технического задания на автоматизированную систему
5.1 Назначение и цели создания системы
5.1.1 Назначение, сфера функционирования АС. Вид автоматизируемой деятельности
Разрабатываемая автоматизированная система анализа технологических параметров производства продукции предназначена для более глубокого контроля технологического процесса, и тем самым получения максимально приближенной к заданному качеству продукции и снижения процента брака
Сфера функционирования разрабатываемой автоматизированной системы - крахмальное производство.
Данная система управления технологическим процессом предусматривает использование не только крахмального производства в качестве объекта, но и другие области, где необходим анализ, моделирование, контроль, прогнозирование технологии, на основе чего делаются конкретные выводы о корректности протекания технологического процесса.
Автоматизированная система должна решать задачи ввода, анализа и обработки, представления результатов в различных формах, удобных для восприятия и обеспечения взаимодействия пользователя с системой с использованием дружественного интерфейса.
По своему функциональному назначению подсистема относится к классу информационно-советующих систем, в иерархии управления она должна занимать один из верхних уровней.
5.1.2 Цели создания АС
Использование данной подсистемы позволит:
§ уменьшить диапазоны технологических факторов, что позволит снизить влияние нестабильности технологии;
§ выбирать технологические диапазоны с максимально возможной вероятностью получения качественной продукции в рамках заданного критерия качества для вида продукции, что с максимальной вероятностью гарантирует получение низкого процента брака;
§ выбирать наиболее значимые факторы, непосредственно влияющие на выходные свойства;
§ производить поэтапную корректировку технологических диапазонов в соответствии с течением реального технологического процесса с учетом колебаний состава сырья и способов его обработки.
В результате создания автоматизируемой системы должны быть достигнуты следующие показатели эффективности функционирования объекта автоматизации:
§ повышение точности производимых расчетов;
§ снижение числа ошибок в принимаемых решениях;
§ уменьшение затрат времени и труда группы лиц, занятых в работе по повышению качества производимой продукции.
Применение проектируемой системы целесообразно в нескольких случаях:
§ технологический процесс содержит большое количество этапов;
§ этапы включают большое количество технологических факторов;
§ получение результатов расчета другими способами не обеспечивает достаточной оперативности.
5.2 Требования к системе в целом
5.2.1 Описание общей функциональной структуры автоматизированной системы
Автоматизированная подсистема анализа технологических параметров производства продукции должна представлять собой единый модуль, содержащий несколько блоков решающих различные подзадачи, для корректного функционирования всей подсистемы в целом (рис. 8).
Рис. 8. Функциональная схема АС
В соответствии с конкретными целями и задачами управления в состав разрабатываемой подсистемы входят следующие функциональные подсистемы:
· подсистема ввода исходных данных:
обеспечивает ввод исходных данных. Данная подсистема осуществляет считывание данных из файлов базы данных технологического производства для их непосредственного использования другими подсистемами;
· подсистема дисперсионного анализа:
позволяет выделить наиболее важные факторы, то есть те факторы, которые обеспечивают наибольшее влияние на конечные свойства. Результаты расчетов, которые представляют собой уровни значимости факторов, используются в подсистемах факторного и кластерного анализа;
· подсистема факторного анализа:
позволяет получить значимость факторов, используя эксперта. Также можно сопоставить данные, полученные по результатам дисперсионного анализа и проверить информативность выбранных факторов. Результатом работы данной подсистемы являются значимости факторов и также используются в подсистеме кластерного анализа;
· подсистема кластерного анализа:
используя данные, полученные в результате работы дисперсионного и/или факторного анализа, данная подсистема позволяет объединить различные опыты технологического процесса в некоторые сгустки технологического пространства (технологии), т.н. «кластеры» по сходным признакам. Также данная подсистема, используя критерий информации I, может выделить наиболее подходящую технологию, обладающую наибольшим количеством удачных экспериментов. Результатом работы данной подсистемы будут множества экспериментов сгруппированных в кластеры. Данная информация может быть использована при работе подсистемы дискриминантного анализа.
Вся подсистема должна функционировать в автоматизированном режиме, т.е. в режиме, предусматривающем совместные действия пользователя и системы для получения конечного результата работы. Во время работы с данной подсистемой пользователь может использовать те или иные методы в каждой из подсистем, используя существующие настройки. Структура системы должна предусматривать возможность расширения выполняемых функций, а также модернизацию действующих алгоритмов.
5.2.2 Описание требований к численности и квалификации персонала (пользователей) АС, режиму работы персонала
Функционирование автоматизированной подсистемы анализа технологических факторов производства будет происходить под управлением операционной системы из семейства Microsoft Windows, которая обладает интуитивно понятным интерфейсом и обеспечивает удобное взаимодействие пользователей с системой. Для эффективной работы пользователей с автоматизированной системой, персоналу необходимо:
· уметь работать с приложениями ОС Windows;
· быть знакомым с принципами функционирования системы;
· обладать специальными знаниями анализируемой предметной области.
Для работы с системой достаточно одного пользователя, в обязанности которого входит выполнение требований по работе с данной системой.
5.3 Требования к функциям
5.3.1 Описание информационных функций по каждой подсистеме и решаемых в рамках каждой функции задач
В соответствии с конкретными целями и задачами управления в состав разрабатываемой автоматизированной системы анализа технологических факторов производства должны входить следующие функциональные подсистемы:
· подсистема ввода исходных данных использует данные, находящиеся в файлах базы данных в виде значений факторов и свойств и должна:
- обеспечивать открытие файлов баз данных и чтение из них необходимой информации;
· подсистема статистического анализа
- обеспечивать статистический анализ данных;
· подсистема дисперсионного анализа может использовать данные, полученные через подсистему ввода и данные результатов работы подсистемы факторного анализа и должна:
- выделять наиболее значимые факторы, то есть те факторы, которые обеспечивают наибольшее влияние на конечные свойства;
· подсистема факторного анализа может использовать данные, полученные через подсистему ввода и данные результатов работы подсистемы дисперсионного анализа и должна:
- рассчитывать значимости факторов;
- сопоставляя данные, полученные по результатам дисперсионного анализа и проверять информативность выбранных факторов;
· подсистема кластерного анализа использует данные, полученные через систему ввода и данные о том, какие факторы и свойства должны использоваться (результат работы дисперсионного и/или факторного анализов) должна:
- объединять различные опыты технологического процесса в некоторые сгустки технологического пространства (технологии), т.н. «кластеры» по сходным признакам;
- используя критерий информации I, может выделять наиболее подходящую технологию, обладающую наибольшим количеством удачных экспериментов;
· подсистема формирования результатов используя результаты работы других подсистем должна;
- обеспечивать представление результатов работы системы в виде, понятном и удобном для пользователя (графики, гистограммы, таблицы).
Во время функционирования системы можно получить справочную информацию:
· помощь по программе, дающая возможность пользователю изучить особенности работы программы при первом запуске подсистемы;
· справочную информацию о принципах работы системы;
· общая информация о подсистеме, включающая в себя сведения об авторе проекта и его названии;
При функционировании каждой подсистемы и системы в целом имеют место следующие особенности:
· необходимая точность измерения обуславливается видами данных и в среднем составляет 10 знаков после запятой;
· диапазон возможных значений факторов технологического процесса лежит в пределах возможных значений используемых в системе;
В процессе разработки данной системы, необходимо исключить возможные ошибки в работе системы, исключить возможность аварийной ситуации, применив специальные обработки.
5.4 Требования к видам обеспечения
5.4.1 Требования к математическому обеспечению
При разработке проектируемой автоматизированной подсистемы анализа технологических факторов производства предполагается использовать следующие математические методы и алгоритмы, подробное описание которых приведено в п. 4.1.:
· алгоритм дисперсионного анализа:
· алгоритм факторного анализа:
- метод главных компонент;
· алгоритмы кластерного анализа:
- итеративные методы:
ѕ метод к-средних;
ѕ FOREL;
ѕ KRAB;
· алгоритм расчета количества информации на основе энтропии.
5.4.2 Требования к информационному обеспечению
Информационное обеспечение системы должно быть достаточным для выполнения всех функций системы.
Организация внутримашинного информационного обеспечения должна обеспечивать эффективные способы хранения, поиска и извлечения требуемых данных и не нарушать их целостность. Информационная база системы должна включать такое количество информационных массивов, которое необходимо для хранения и обработки всей совокупности данных используемых в ходе решения задачи.
Организация внемашинного информационного обеспечения должна обеспечивать достоверность, однозначность, своевременность и непротиворечивость входной и выходной информации. Перед использованием в системе исходная информация должна проходить проверку на достоверность.
Представление выходных результатов работы системы должно быть организовано в виде наглядных таблиц, графиков.
Средства и алгоритмы хранения и обработки данных в системе должны обеспечивать необходимую точность и быстродействие выполнения всех информационных функций.
Защита данных от разрушения при авариях, приводящих к потере данных на носителях, производится с помощью средств СУБД. Вред от аварийных остановов системы в результате отключения электроэнергии рекомендуется снижать с помощью использования специализированных устройств, обеспечивающих бесперебойную передачу электропитания, в случае сбоя в сети, а также передачу энергии из собственных ресурсов или полном отключении энергоснабжения (ИБП). ИБП обеспечивает работу компьютера после прекращения поступления электропитания в течение времени, необходимого для корректного завершения операций ввода-вывода, сохранения данных, сброса буферов, а также протокольных мероприятий выхода из системы.
5.4.3 Требования к лингвистическому и программному обеспечению
Лингвистическое обеспечение АС должно быть достаточным для создания и нормальной работы системы в целом и подсистемы анализа технологических факторов производства в частности. Взаимодействие оператора с системой должно быть организованно в диалоговом режиме посредством дружественного интерфейса, обеспечивающий понятный доступ ко всем функциям системы.
Для реализации данной системы было крайне затруднительным использование языков программирования низкого уровня (например Ассемблер) в следствии достаточной сложности, поэтому был использован язык программирования высокого уровня С++, используя среду разработки Borland Builder C++ 5.0.
Управление системой осуществляется с помощью клавиатуры для ввода данных и манипулятора типа «мышь» для перемещения по полям, закладкам, таблицам и т. п.
Необходимое программное обеспечение:
· Сертифицированная операционная система семейства MS Windows 9x/Me/NT/2000/XP с поддержкой русского и английского языков;
· программное обеспечение используемых ТС (драйверы устройств);
· ядро системы управления базами данных Borland DataBase Engine(BDE).
Программное обеспечение АС должно выполнять следующие требования к качеству программных средств, способам его обеспечения и контроля (ГОСТ_28195-89, 28806-90):
· выполнение всех функций, реализуемых с участием программируемых средств вычислительной техники;
· средства организации всех требуемых процессов обработки данных;
· возможность расширения с учетом перспектив развития пакета программ, т.е. иметь возможность добавить новые методы обработки информации;
· необходимый контроль вводимой информации, в том числе проверки на наличие запрещенных кодовых комбинаций, логическую непротиворечивость отдельных данных, соответствия полей и данных введенных в них;
· удовлетворение требования общей правильности, которое будет проверяться контрольными примерами. Правильность функционирования системы также может быть проверена двухэтапным доказательством правильности, когда сначала доказывается правильность выполнения отдельных подзадач, а затем правильность их взаимодействия в системе;
· в связи большого объёма входных данных необходимого для работы данной подсистемы, необходимо обеспечить такое действие алгоритмов, чтобы ограничение памяти не было критичным;
· обеспечение переносимости используемых математических алгоритмов;
· использование модульного принципа при создании данной системы позволит при необходимости добавить функции АС без существенной переделки её функциональной части;
· отсутствие зацикливаний, ошибочных остановок и аварийных выходов во время работы системы;
· время расчетов не должно занимать длительное время, в противном случае извещать об этом и в таких случаях, использовать индикатор хода расчетов.
5.4.4 Требования к техническому обеспечению
Состав и структура используемых технических средств должны обеспечивать:
· реализацию всех функций;
· возможность модернизации и развития пакета программ;
· взаимозаменяемость одноименных технических средств без каких-либо изменений или регулировок в остальных устройствах.
В соответствии с предварительной разработкой структуры информационной базы, необходим следующий примерный состав комплекса технических средств:
· Сертифицированного ПЭВМ типа IBM PC на базе процессора Pentium IV или его аналогов.
· ОЗУ не менее 256 Мб, что вызвано использованием ОС Windows 2000/XP, а также большим количеством динамически сформированных в процессе выполнения программы массивов и переменных.
· SVGA - адаптер и монитор обеспечат необходимое разрешение для обеспечения визуализации текстовой и графической информации.
· НЖМД - для хранения файлов операционной системы и информационной системы емкостью не менее 80 Гб, для обеспечения свободного места для установки сопутствующего программного обеспечения.
· Клавиатура - англо-русский тип клавиатуры.
· Манипулятор типа 'мышь'. Для обеспечения простого дружественного диалога пользователя с системой без специальной длительной подготовки.
Энергопитание средств вычислительной техники должно быть обеспечено в соответствии с требованиями ее технической эксплуатации.
Размещение технических средств должно производиться с учетом правил техники безопасности, условий эксплуатации, требований норм технической эстетики и других руководящих и нормативных документов.
5.4.5 Требования к организационному обеспечению
Для нормального функционирования системы с заданными временными и надежностными показателями необходимо обеспечить четкий порядок и последовательность выполнения операций процесса подготовки и обработки данных. В связи с этим должна быть разработана инструкция, содержащая сведения о процессе подготовке и обработки данных, а также процессе представления и использования выходных результатов. В инструкции необходимо привести перечень должностей, ответственных за процесс сбора информации, ввода исходных данных, получения и использования выходных результатов, а в соответствующие должностные инструкции необходимо внести обязанности и описания действий должностных лиц, связанных с функционированием системы.
Для обеспечения подготовки пользователей сотрудники, в должностные обязанности которых будет входить работа с системой, должны пройти обучение, организуемое разработчиком системы.
Для обеспечения эксплуатации системы: обслуживанию программных и технических средств системы, необходимо из штата соответствующего отдела АСУ предприятия выделить оператора, в должностные обязанности которого, наряду с работами, связанными с эксплуатацией других АС, должны быть включены работы по поддержанию информационной базы системы в работоспособном состоянии. Оператор также должен пройти обучение.
5.4.6 Требования к метрологическому обеспечению
Разрабатываемая подсистема при своем функционировании не использует измерительные каналы.
6.Логическое проектирование автоматизированной системы
6.1 Разработка общей концепции системы
6.1.1 Краткий сравнительный анализ разрабатываемой АС и ее известных аналогов
Автоматизированная система анализа технологических факторов производства, решающая задачу анализа технологических параметров, на основе чего делаются конкретные выводы о корректности протекания технологического процесса. Данная система предусматривает решение задачи выбора оптимальной технологии, уменьшение диапазонов технологических факторов, выбор факторов, оказывающих наибольшее влияние на конечные свойства продукта, поэтапную корректировку технологических диапазонов в соответствии с течением реального технологического процесса с учетом колебаний состава сырья и способов его обработки.
В настоящее время существует много различных пакетов для статистической обработки информации, такие как: Stata, Statgraphics, DSTAT, SAS, SPSS, MathLab.
Достоинства:
· содержат большой спектр статистических методов обработки информации.
Недостатки:
· Закрытость исходных текстов;
· Обособленность, т.е. достаточно тяжело использовать данные, полученные в результате работы, в других приложениях.
· Достаточно высокая стоимость.
Создание АС анализа технологических факторов производства на основе анализа экспериментальных данных в целом не является оригинальной разработкой, однако некоторые подходы анализа (совокупное применение дисперсионного, факторного, кластерного, анализ технологии с учетом затрат) реализуются впервые.
6.1.2 Схема функциональной структуры системы
В соответствии с конкретными целями и задачами управления в состав разрабатываемой автоматизированной системы идентификации глобальной технологии входят следующие функциональные подсистемы (рис. 9):
· подсистема ввода исходных данных:
обеспечивает ввод исходных данных (массивов экспериментальных данных технологии и выходных свойств). Данная подсистема осуществляет только считывание исходных данных.
· подсистема факторного анализа:
позволяет получить значимость факторов, используя эксперта. Результатом работы данной подсистемы являются значимости факторов и используются в подсистемах факторного и кластерного анализа;
· подсистема дисперсионного анализа:
позволяет выделить наиболее важные факторы, то есть те факторы, которые обеспечивают наибольшее влияние на конечные свойства. Результаты расчетов, которые представляют собой уровни значимости факторов, используются в подсистеме кластерного анализа;
· подсистема кластерного анализа:
используя данные, полученные в результате работы дисперсионного и/или факторного анализа, данная подсистема позволяет объединить различные опыты технологического процесса в некоторые сгустки технологического пространства (технологии), т.н. «кластеры» по сходным признакам. Также данная подсистема, используя критерий информации I, может выделить наиболее подходящую технологию, обладающую наибольшим количеством удачных экспериментов. Результатом работы данной подсистемы будут множества экспериментов сгруппированных в кластеры;
Рис 9. Схема функциональной структуры АС.
6.1.3 Описание автоматизируемых функций и комплекса решаемых задач
Разрабатываемая автоматизированная система анализа технологических факторов производства предназначена для более глубокого контроля технологического процесса, и тем самым получения максимально приближенной к заданному качеству продукции и снижения процента брака.
Автоматизированная система должна решать задачи ввода информации, ее обработки, представления результатов в различных формах, удобных для восприятия и обеспечения взаимодействие пользователя с системой с использованием дружественного интерфейса.
Подсистема ввода исходных данных
Цель подсистемы: обеспечить ввод исходных данных (массивов экспериментальных данных технологии и выходных свойств).
Функции подсистемы:
· загрузка данных (массивов экспериментальных данных технологии и выходных свойств). Периодичность выполнения этой функции зависит от пользователя. Продолжительность выполнения этой функции зависит от используемых технических средств, выбранной для работы СУБД и объема загружаемых данных;
Входная информация - массивы экспериментальных данных технологии: факторов и выходных свойств.
Выходная информация - массивы экспериментальных данных технологии и выходных свойств находящиеся в оперативной памяти и пригодные для их дальнейшей обработки.
Подсистема дисперсионного анализа.
Цель подсистемы:
Выделить факторы, обеспечивающие наибольшее и наименьшее влияние на конечные свойства, тем самым указать какие факторы можно не использовать при дальнейших расчетах (т.е. снизить размерность решаемых задач).
Функции подсистемы:
· выделение факторов, обеспечивающих наибольшее и наименьшее влияние на конечные свойства.
Входная информация - массивы экспериментальных данных технологии (факторов и свойств), набор факторов и свойств.
Выходная информация - выделение полей таблицы (факторов), обеспечивающих наибольшее и наименьшее влияние на конечные свойства.
Подсистема факторного анализа.
Цель подсистемы:
Проверить достаточно ли информации содержится в выбранных для анализа факторов.
Функции подсистемы:
· рассчитывать значимости факторов;
· проверять информативность выбранных факторов;
Входная информация:
· массивы экспериментальных данных технологии;
· набор факторов;
Выходная информация:
· сообщение о степени информативности выбранных факторов;
· список, указывающий степень информативности того или иного фактора.
Подсистема кластерного анализа.
Цель подсистемы:
· выделить в технологическом пространстве сгустки (кластеры), наиболее близких экспериментов;
Функции подсистемы:
· выделение сгустков (кластеров) технологий технологического пространства.
Входная информация:
· массивы экспериментальных данных технологии;
· факторы и свойства подлежащие анализу.
Выходная информация:
· границы сгустков (кластеров) технологического пространства;
· количество точек (экспериментов) в составе каждого кластера.
Подсистема формирования результатов:
Цель подсистемы:
используя результаты работы подсистем, обеспечивать представление результатов работы системы в виде, понятном и удобном для пользователя (документы HTML, графики, гистограммы, таблицы).
Функции подсистемы:
· представление результатов в виде графиков, гистограмм, таблиц;
· формирование отчета работы программы;
· сохранение результатов в файл;
Периодичность выполнения этих функций зависит от пользователя. Продолжительность их выполнения зависит от скорости работы использующихся технических средств, а также от объема сохраняемой информации.
Входная информация - данные различного типа, переданные различными подсистемами.
Выходная информация - графики, гистограммы, таблицы, иллюстрирующие результаты работы.
6.1.4 Схема организационной структуры
Организационное обеспечение необходимо для осуществления взаимодействия персонала АС с техническими средствами и между собой в процессе решения задач управления. Схема организационной структуры является одним из основных документов организационного обеспечения (рис. 10). На ней отражены взаимодействия персонала АС между собой и с техническими средствами системы.
Рекомендуемый состав персонала АС:
· Эксплуатационный персонал:
- инженер-системотехник;
· Оперативный персонал:
- инженер-технолог;
- оператор.
Рис. 10. Схема организационной структуры системы
6.2 Разработка решений по специальному математическому обеспечению АС
6.2.1 Общий алгоритм функционирования системы в реальном масштабе времени
Алгоритм функционирования системы представлен на рис. 11
.
Рис. 11. Алгоритм функционирования системы.
6.2.2 Разработка алгоритмов решения отдельных функциональных задач
Алгоритм загрузки информационной базы
Назначение и характеристика.
Данный алгоритм предназначен для загрузки данных из файлов баз данных в формы для их дальнейшей обработки.
Используемая информация.
Названия полей базы данных, численные и строковые значения параметров технологического процесса.
Алгоритм определения значимости факторов методом дисперсионного анализа.
Назначение и характеристика.
Данный алгоритм предназначен для определения значимости влияния факторов на свойства.
Используемая информация.
Массивы экспериментальных данных технологии, список факторов, список свойств.
Описание алгоритма решения
Шаг 1. Создаётся нуль-гипотеза: «фактор не влияет на свойство»;
Шаг1. Расчет суммы квадратов между группами:
;
Шаг2. Расчет суммы квадратов внутри групп:
;
Шаг 3. Расчет числа степеней свободы, связанное с SSw: N-J;
Шаг 4. Расчет числа степеней свободы, связанное с SSb: J-1;
Шаг 5. Расчет среднего квадрата между группами:
Шаг 6. Расчет среднего квадрата внутри групп: ;
Шаг 7. Если F(?; n1, n2) (где F-значение таблицы распределения Фишера с n1 и n2 степенями свободы и уровнем значимости ?), то теория отвергается (т.е. фактор значим), иначе теория принимается (т.е. фактор незначим).
Шаг 8. Конец работы алгоритма.
Алгоритм проверки значимости факторов методом факторного анализа
Назначение и характеристика.
Данный метод предназначен для проверки информативности факторов.
Используемая информация:
Массивы экспериментальных данных технологии, набор факторов.
Описание алгоритмов решения.
В факторный анализ состоит из двух этапов:
· решение задачи методом главных компонент;
· оценка уровня информативности;
Метод главных компонент (рис. 12)
Рис. 12. Алгоритм метода главных компонент
Оценка уровня информативности:
Алгебраическими преобразованиями матрицы факторного отображения А выделяют влияние того или иного фактора на то или иное свойство.
Результат решения:
Значение коэффициента информативности.
Алгоритм кластеризации методами кластерного анализа.
Алгоритм метода к-средних.
Пусть имеется n наблюдений.
Шаг 1. Заполнить матрицу расстояний.
Шаг 2. Среди n наблюдений выбрать k (по любым соображениям) точек, они будут являться центрами новых кластеров.
Шаг 3. Выбирается k+1-й объект и присоединяется к ближнему кластеру, причем центр кластера и его вес пересчитывается по формуле:
, , где
- вектор координат j-го кластера на i-м шаге,
- вес j-го кластера на i-м шаге,
-вектор координат i-го присоединяемого объекта.
Шаг 4. После того как все объекты были распределены, получим кластеры с координатамии весами.
Шаг 5. Все объекты присоединяются заново к существующим кластерам, как указано в Шаг 3.
Шаг 6. Процесс зацикливается до тех пор, пока результат разбиения не будет точно таким же, как предыдущий.
Алгоритм метода FOREL.
Шаг 1. Создать кластер.
Шаг 2. Выбрать центр тяжести свободных точек.
Шаг 3. Отнести все точки в пределах радиуса к кластеру.
Шаг 4. Пересчитать координаты центра кластера, как центр тяжести
всех точек, относящихся к кластеру.
Шаг 5. Присоединить все точки в пределах радиуса к кластеру.
Шаг 6. Если набор точек остался тем же, то шаг 7, иначе шаг 4.
Шаг 7. Если остались свободные точки, то шаг 1, иначе - шаг 8.
Шаг 8. Конец работы алгоритма.
Алгоритм метода KRAB.
Шаг 1. Берём произвольную точку о относим ее к т.н. «графу».
Шаг 2. Ищем расстояния от точки из «графа» до всех свободных точек.
Шаг 3. Включаем самую близкую точку в «граф» (проводим к ней черту - ребро).
Шаг 4. Ищем расстояния от всех точек «графа» ко всем свободным
точкам.
Шаг 5. Включаем ближайшую точку в «граф» (проводим к ней черту -ребро от ближайшей точки из состава «графа»).
Шаг 6. Если есть свободные точки, то шаг 4, иначе шаг 7.
Шаг 7. Разорвать n самых длинных рёбер (n-задаётся пользователем).
Шаг 8. Конец работы алгоритма.
6.3 Разработка решений по информационному обеспечению АС
6.3.1 Принципы организации информационного обеспечения АС
Информационное обеспечение информационной поддержки для автоматизированной системы анализа технологических факторов производства представляет собой совокупность технологической информации, состоящей из массивов данных, файлов различных форматов и файлов базы данных, необходимых для выполнения всех функций АС.
Информационное обеспечение подсистемы строится на базе ПЭВМ. Данные могут быть представлены как на машинных носителях (внутримашинная БД - файлы dBase и Excel), так и на бумажных носителях (внемашинная БД).
Для хранения данных используется жесткий диск, т.к. это устройство обеспечивает не только быстрый доступ к данным, возможность многократной записи, но и предоставляет достаточный объем носителя для записи.
Информация может содержаться в виде базы данных. Использование БД в качестве способа хранения данных позволяет обеспечить основные принципы организации информационного обеспечения, необходимые для подобного класса задач:
доступность информации, представляемой пользователю в виде таблиц;
открытость базы данных, что позволяет без существенных затрат вносить в ее структуру неизбежные в процессе эксплуатации системы изменения;
возможность использования языков программирования высокого уровня для реализации наиболее сложных функций.
6.3.2 Описание организации внутримашинной информационной базы
6.3.2.1 Проектирование внутримашинной информационной базы
Проектирование внутримашинной информационной базы включает в себя инфологическое проектирование АИС, т. е. установление соответствия между состоянием предметной области и ее описанием данными. На этапе инфологического проектирования информационная модель предметной области не связана со средствами реализации АИС. Она определяет особенности предметной области и информационные потребности разрабатываемой подсистемы. Для этого используется диаграмма «сущность - связь».
Предметной областью в данной работе является любой технологический процесс производства. Это может быть, например, производство крахмала или анализ затрат в производстве металла. Рассмотрим его более подробно.
На предприятии функционирует система, одной из задач которой является получение максимально приближенной к заданному качеству продукции. Это можно осуществить за счет изменения технологических границ влияющих на производство факторов с учетом выходных стандартизированных свойств готовой продукции - стандартов. Для этого производится сбор экспериментальных данных, определяются факторы, влияющие на результат производства (анализируется текущий передел) и формируется выборка экспериментальных значений..
Таким образом, можно предположить, что в АИС будет накапливаться информация об экспериментальных значениях различных режимов производства.
Для работы системе в качестве исходных данных требуется одна таблица с произвольным набором полей (факторы и свойства, определяемые пользователем) и произвольным количеством записей (экспериментальные значения). Для выполнения функций системы не требуется дополнительных таблиц. Поэтому нет необходимости формировать связи с другими таблицами, что объясняет отсутствие механизмов базы данных (первичного ключа).
Проанализировав особенности предметной области, можно выделить одну сущность и ряд атрибутов, которые представлены на рис. 13, необходимости в построении диаграммы «Атрибут-атрибут» нет.
Спецификации атрибутов представлены в табл. 3.
Таблица 3. Спецификация атрибутов
Тип сущности |
Название атрибутов |
Назначение атрибута |
Тип атрибута |
Длина |
Примечание |
|
ТЕХНОЛОГИЯ |
Поле 1 |
Описательный |
Символьный |
15 |
||
Поле 2 |
Описательный |
Цифровой, с плавающей точкой |
15 |
|||
Поле 3 |
Описательный |
Цифровой, с плавающей точкой |
15 |
|||
… |
… |
… |
… |
… |
||
Поле m |
Описательный |
Цифровой, с плавающей точкой |
15 |
6.3.2.2 Состав и структура внутримашинной информационной базы
Внутримашинная информационная база АС состоит из таблиц БД и Excel. Для работы системы может быть использована любая таблица, содержащая в себе данные технологического производства продукции, поэтому отсутствует необходимость в перечне таблиц.
6.3.2.3 Ведение внутримашинной информационной базы
Ведение внутримашинной базы обеспечивается средствами СУБД dBase с использованием процессоров баз данных фирмы Borland - Borland Database Engine (BDE) и Microsoft Excel. Эти средства обеспечивают интерфейс между низким уровнем (физическим) представлением БД и ее представлением на внешнем (логическом) уровне, на котором происходит взаимодействие с другими подсистемами.
Все внутренние операции происходят автоматически под контролем СУБД. Внешнее управление БД из других систем может быть осуществлено посредством специальных команд.
6.3.3 Организация внемашинной информационной базы
6.3.3.1 Проектирование внемашинной информационной базы
Внемашинная информационная база представляет собой совокупность всех документированных входных и выходных данных. Подготовка специальных бумажных первичных документов для ввода не предусматривается. Ввод первичной информации осуществляется из БД.
Внемашинная ИБ представляет собой экспериментальные данных процесса производства продукции.
Выходные документы могут выдаваться по желанию пользователя, в двух режимах:
вывод на экран в виде таблиц;
экспорт результатов в файл.
6.3.3.2 Состав и структура внемашинной информационной базы
6.3.3.3 Ведение внемашинной информационной базы
Ведение внемашинной информационной базы полностью возлагается на сотрудников предприятия. Со стороны подсистемы никаких ограничений не предусмотрено.
6.3.5 Чертежи форм документов и видеокадров
При организации ввода и редактирования исходных данных системы предоставлен удобный, интуитивно понятные для пользователя средства. Они реализованы в виде стандартных окон пользовательского интерфейса ОС Windows. Каждая форма содержит различные элементы - кнопки, поля ввода текста, таблицы, переключатели, списки и т.д. Размер каждой формы подобран таким образом, чтобы обеспечить оптимальное зрительное восприятие всех элементов формы.
Каждая форма должна имеет название, соответствующее назначению формы. Формы использует по умолчанию оформление стандартной схемы Windows - серый цвет фона формы, название формы - белым на синем фоне. Размеры элементов формы подобраны таким образом, чтобы текст, соответствующий элементу умещался на нем полностью.
Рассмотрим общие свойства элементов, которые располагаются на формах.
· Название формы - имя, определяющее содержание и назначение текущего окна.
· Меню - классифицированный по какому-либо признаку список действий, которые осуществляются из текущего окна. Отображается под названием формы. Классификация произведена таким образом, чтобы неквалифицированный пользователь мог без труда найти и выполнить любую возможную в рамках данной формы операцию
· Таблица - стандартная таблица отображения численных значений, полученных в результате расчетов, или использующаяся для ввода данных. Высота и ширина ячеек таблицы подобраны таким образом, чтобы все числовое значение помещалось в ячейку. Также предусмотрен скроллинг, как по горизонтали, так и по вертикали. Таблица содержит заголовок, отражающий суть данных, наполняющих ее.
· График - область, в которой располагаются графики функциональных зависимостей, гистограммы. Работа с графиком предусматривает ряд действий, упрощающих восприятие отображаемой информации - увеличение выбранной области, сдвиг по осям, возвращение в исходное состояние. Каждый график имеет название, отражающее суть графически представленной информации.
· Кнопки - кнопки выполнения функций. Размер кнопки подобран таким образом, чтобы название помещалось на ней.
· Список - неструктурированное перечисление необходимых элементов для выбора и дальнейшего использования. Имеет вертикальный скроллинг в случае большого числа строк.
· Окно отображения - область для вывода любой информации (данные, текст помощи, справки и т.п.). Предусмотрена возможность скроллинга как вертикального, так и горизонтального для прокрутки и сохранения содержимого в файл.
Форма меню выбора рабочей базы
При первоначальном запуске системы появляется окно «Меню» для выбора базы, с которой система будет работать (рис. 14).
Рис. 14. Окно меню выбора информационных баз
Для выбора необходимо указать в окошке списка нужную базу и подтвердить выбор кнопкой «Выбрать». В нижней части окна указывается путь к данной базе. При выборе информационной базы, окно закрывается и запускается система, которая будет в дальнейшем использовать эту информационную базу.
Существует возможность добавления новых информационных баз в список. Это возможно сделать, нажав кнопку «Добавить». После нажатия этой кнопки появляется окно регистрации информационной базы (рис. 15).
Рис. 15. Окно регистрации информационных баз
Для регистрации новой базы, необходимо:
· указать в поле «название» название информационной базы, под которым она будет представлена в списке информационных баз;
· указать в поле «путь» путь к базе данных. Указать путь можно двумя способами:
1) набрать путь к базе с помощью клавиатуры;
2) воспользоваться диалогом открытия базы данных, который открывается при нажатии кнопки «…» (рис. 16):
· Подтвердить выбор, нажав кнопку «Открыть».
Рис. 16. Диалог открытия базы данных
При подтверждении выбора, поле «Путь» на форме регистрации информационных баз будет содержать путь к информационной базе и её название, например «D:DiplomDataBasesKrahmal.dbf». При отказе, т.е. нажав кнопку «Отмена» в диалоге открытия баз данных, поле «Путь» останется пустым.
Подтверждение добавления новой информационной базы происходит после нажатия кнопки «Добавить» на форме регистрации информационных баз, при условии корректного заполнения вышеуказанных полей. В противном случае, система будет игнорировать нажатие этой кнопки.
Можно отказаться от добавления новой информационной базы, нажатием кнопки «Отмена» на форме регистрации информационных баз. При нажатии этой кнопки окно регистрации информационных баз закрывается и добавление информационной базы не происходит.
Изменить находящуюся в списке информационную базу (при этом изменяться будет та база, на которой в этот момент будет стоять курсор), можно нажав кнопку «Изменить» в окне меню выбора информационных баз. Последовательность действий и появляющиеся окна будут такими же, как при добавлении новой информационной базы, за исключением окна регистрации информационных баз. Здесь поля «Название» и «Путь», будут заполнены и название кнопки «Добавить» заменено на «Изменить».
Удалить информационную базу из списка, можно выставив указатель на эту базу, нажав кнопку «Удалить» на окне меню выбора информационных баз и подтвердив выбор в окне подтверждения удаления информационной базы (рис. 17).
Рис. 17. Окно подтверждения удаления информационной базы
При нажатии кнопки «Да» происходит удаление информационной базы из списка, при этом сама база не удаляется. При нажатии кнопки «Нет» информационная база остается в списке.
Кнопка «Закрыть» в окне меню выбора информационных баз служит для закрытия диалогового окна.
После кнопки «Выбрать» появляется окно выбора работ.
После выбора данной подсистемы анализа технологических факторов производства, появляется форма исходных данных (рис. 19):
Рис. 19. Форма исходных данных
Загрузить данные можно двумя способами (рис. 20):
- из любого базы данных при ее выборе в стандартном диалоге открытия файла (последовательность действий описана выше), выбрав пункт меню «Загрузить».
- из информационной базы выбранной в главном меню, выбрав пункт меню «Загрузить из выбранной базы»;
Рис. 20. Загрузка информационной базы
На данной форме присутствуют следующие объекты:
- Список «Факторы» содержит названия полей информационной базы и имеет возможность отмечать и разотмечать их для дальнейшей обработки.
- Список «Поля базы данных» содержит названия полей информационной базы, которые не задействованы в расчетах.
- Список «Свойства» содержит названия полей информационной базы и имеет возможность отмечать и разотмечать их для дальнейшей обработки.
Существует возможность групповой обработки списков «Факторы» и «Свойства»:
- нажав правую кнопку мыши на одном из списков, появляется меню «Отметить все», «Разотметить все» и «Инвертировать»;
- при выборе пункта «Отметить все», все поля соответствующего списка помечаются галочками;
- при выборе пункта «Разотметить все», у всех полей соответствующего списка галочки снимаются.
Также можно перетаскивать с помощью мыши названия полей между списками «Факторы», «Свойства» и «Поля базы данных».
В таблице исходные данные находится содержимое информационной базы. Возможность редактирования данных отсутствует.
Для дальнейшей работы можно выбрать пункты меню «Анализ факторов», «Кластерный анализ», «Дискриминантный анализ», «Справка» и «Выход» в порядке, предусмотренном алгоритмом работы системы (п.6.2), в противном случае пункты меню будут неактивны.
Пункт меню «Анализ технологий» содержит три подменю «Дисперсионный анализ», «Факторный анализ» и «Кластерный анализ» (рис. 21).
Рис. 21. Отображение подменю анализа факторов
При выборе пункта «Дисперсионный анализ» некоторые поля списка «Факторы» будут отмечены или разотмечены в соответствии работы данного алгоритма. Подтверждение данного действия (установить или снять отметку с полей списка «Факторы») будет предложено пользователю в следующей диалоговой форме (рис 22):
Рис. 22. Окно подтверждения для дисперсионного анализа
При выборе в пункте «Факторный анализ» (рис. 23)
Рис. 23. Отображение подменю факторного анализа
«Анализ всех факторов», после необходимых расчетов появится форма содержащая список факторов со значениями их вклада в составе других факторов (рис. 24):
Рис. 24. Окно информативности факторного анализа
При выборе того или иного фактора их значения суммируются.
По кнопке «Применить» форма закрывается, и факторы отмечаются в списке «Факторы» в соответствии с данной формой.
· «Проверка информативности выбранных факторов», после необходимых вычислений появляется форма, содержащая в себе суммарное значение выбранных факторов (рис. 25):
Рис. 25. Окно информативности выбранных факторов
По кнопке «ОК» данная форма закрывается и управление переходит форме исходных данных (рис. 19).
При выборе пункта меню «Кластерный анализ» появится форма кластерного анализа (рис. 26).
Рис. 26. Форма исходных данных кластерного анализа
На данной форме представлены данные для их обработки методами кластерного анализа. Здесь можно выбрать вид обрабатываемых данных (исходные данные или нормированные данные)
При выборе закладки «Метод к-средних» появляются элементы интерфейса для работы метода к-средних (рис. 27).
Рис. 27. Форма исходных данных метода «к-средних»
На данной форме есть возможность выбора количества образуемых кластеров.
В таблице «Центры» представлена информация о центрах кластеров.
В таблице «Значения» представлены кластеризуемые значения.
В поле «Итерации» содержатся итерации решения
Если для расчетов используются два фактора/свойства, то результат работы метода к-средних можно увидеть наглядно в графике (рис. 28):
Рис. 28. График результатов работы кластерного анализа
При выборе закладки «FOREL» отображаются элементы интерфейса для работы (рис. 29).
Рис. 29. Исходные данные метода «FOREL»
Так же, как и в методе к-средних, если для расчетов используются два фактора/свойства, то результат работы метода можно увидеть наглядно в графике (рис. 30):
Рис. 30. График результатов работы метода «FOREL»
При выборе закладки «KRAB», появляются элементы диалога метода (рис. 31).
Рис. 31. Исходные данные метода «KRAB»
Также, при выборе двух факторов/свойств можно увидеть наглядно результат работы метода (рис. 32).
Рис. 32. График результатов работы метода «KRAB»
При выборе пункта меню «Настройки», отображается форма для настроек работы системы (рис. 33):
Рис. 33. Окно настроек системы
При выборе меню «Справка», появляется окно со справочной информацией о работе с системой (рис. 34).
Рис. 34. Окно справочной информации по работе с системой.
При выборе пункта меню «О программе» в форме исходных данных появляется окно со справочной информацией о названии системы, разработчике данного продукта и научном руководителе (рис. 35).
Рис. 35. Окно «О программе»
При выборе пункта меню «Выход» в форме исходных данных программа завершает свою работу.
6.4 Разработка решений по техническому обеспечению
6.4.1 Описание и структурная схема КТС АС
6.4.1.1 Структурная схема КТС АС
Структура АС построена по принципу клиент-сервер, что определило и структуру КТС (рис. 36).
Рис. 36. Структурная схема комплекса технических средств.
6.4.1.2 Общее описание КТС АС
В состав КТС входят:
сервер БД, на котором хранятся все данные необходимые системе на данном предприятии;
рабочая станция администратора системы, с которой осуществляется настройка системы и ее мониторинг;
группа клиентских рабочих станций пользователей, распределенных по предприятию и взаимодействующих с сервером БД, с которых осуществляется работа в системе.
Клиентские рабочие станции устанавливаются в местах, где они необходимы для доступа к системе.
Параметры КТС должны удовлетворять системным требованиям выбранной СУБД. В качестве СУБД предлагается использовать dBase, для работы которой рекомендуется использовать следующие средства.
· Операционная система: Windows 98/NT/ME/2000/XP.
· Память: 256 МВ минимум; рекомендуется 512 МВ или более.
· Процессор: Intel Pentium III минимум, рекомендуется Pentium IV или его аналоги.
Для предотвращения аварийных ситуаций, необходимо выполнение требований предъявленных в п.5.2.6 и п.5.2.7.
6.4.1.3 Вычислительный комплекс
Основным решением по выбору ЭВМ была необходимость удовлетворения данным ЭВМ современным параметрам для нормального функционирования данной системы. Для функционирования данной системы необходимо одно рабочее место с ЭВМ, требование к конфигурации которого описано в п. 6.4.1.2 и которое удовлетворяет п.5.4.4.
Рекомендуемый состав рабочего персонала - 3 человека: инженер-технолог (для эксплуатации данной АС), инженер-системотехник (для поддержания КТС в работоспособном состоянии) и оператор (для внесения данных).
6.4.1.4 Аппаратура сбора информации с объекта. Функциональная схема сбора информации
В данном проекте сбора информации с объекта не осуществляется, необходимые для анализа данные загружаются из файлов БД или Excel.
6.4.1.5 Аппаратура передачи данных
В рамках рассматриваемой системы аппаратура передачи и обмена данными ограничивается стандартно используемыми устройствами, применяемыми для реализации структуры «клиент-сервер». В частности в набор необходимого оборудования входят адаптеры, кабель и разветвители. Поскольку топология сети, выбранная для данной системы, должна быть построена по иерархическому принципу с двумя уровнями, можно обойтись стандартными распространенными устройствами типа «хаб» и «сетевая карта». В случае выбора среды передачи данных на основе коаксиального кабеля, необходимость в использовании разветвителей отпадает в силу небольшого количества подключаемых клиентов и высокой их территориальной сконцентрированности. Если задачу выбора среды передачи данных планируется решать на стадии физического монтажа системы, рекомендуется использовать сетевые адаптеры типа «combo», то есть имеющими как интерфейс BNC, так и RJ-45. Скорость работы вполне может ограничиваться 10 Мб/сек.
6.4.1.6 Аппаратура ручного ввода информации и представления данных
Для реализации процесса ручного ввода информации в систему необходим следующий набор технических средств:
· клавиатура (англо-русский тип клавиатуры, 108 клавиш);
· манипулятор типа “мышь” для IBM PC.
Для представления данных используется:
· SVGA монитор для IBM PC.
6.4.1.7 Аппаратура воздействия на объект управления
Проектируемая система не воздействует на объект управления.
6.4.1.8 Аппаратура локальной автоматики
В данном проекте не используется аппаратуры локальной автоматики
6.5 Разработка решений по программному обеспечению
6.5.1 Структура программного обеспечения
Специальное программное обеспечение АСУ рассчитано на работу под управлением операционной системы Windows 9х/ME/2000/NT/XP. Функционирование специального программного обеспечения возможно при наличии установленной системы управления базами данных Borland Database Engine (BDE). Специальное программное обеспечение системы анализа технологических параметров производства продукции представляет собой единый исполняемый модуль. В его составе можно выделить основные функции:
1. Функция ввода - считывает данные технологического процесса в оперативную память.
2. Функция статистического анализа исходных данных предоставляет пользователю возможность визуально оценить данные путём построения его графика, диаграммы и статистические характеристики.
3. Функция факторного анализа - выполняет выбор наиболее информативных факторов технологического производства на основе пользовательских настроек.
4. Функция дисперсионного анализа - осуществляет проверку гипотезы о наличии связи между исследуемыми факторами и свойствами.
5. Функция кластерного анализа - выполняет автоматическое разбиение технологических режимов на классы (кластеры) на основе пользовательских настроек.
6. Функция формирования отчёта - обеспечивает представление результатов работы системы в виде, понятном и удобном для пользователя.
При разработке автоматизированной системы использовался язык программирования С++ с применением среды визуальной разработки приложений Borland C++ Builder 5.0.
Исходный код специального программного обеспечения состоит из следующих файлов, представленных в табл. 5.
Таблица 5. Описание файлов исходных кодов.
Имя файла |
Описание |
|
Main.cpp |
Главный интерфейсный модуль. Вызывает модули Settings.cpp, Help.cpp, About.cpp, Fisher*.dat. Загружает исходные данные, управляет доступностью к другим функциям, используя главное меню, осуществляет выбор используемых данных, содержит в себе методы факторного и дисперсионного анализов. |
|
Входные данные: см п.6.1.3. |
||
Выходные данные: см п.6.1.3. |
||
KA.cpp |
Содержит в себе методы кластерного анализа. |
|
Входные данные: см п.6.1.3. |
||
Выходные данные: см п.6.1.3. |
||
Settings.cpp |
Содержит настройки системы. |
|
Входные данные: сохраненные настройки системы. |
||
Выходные данные: измененные настройки системы для сохранения. |
||
Help.cpp |
Позволяет пользователю вывести справочную информацию. |
|
Входные данные: справочная информация по работе с системой. |
||
Выходные данные: отсутствуют. |
||
About.cpp |
Содержит информацию об авторе и т.п. |
|
Входные данные: отсутствуют. |
||
Выходные данные: отсутствуют. |
||
Menu.cpp |
Диалоговое окно для выбора используемой информационной базы. Вызывает модуль Dialog.cpp, передаёт управление модулю Main.cpp. |
|
Входные данные: список зарегистрированных баз данных. |
||
Выходные данные: путь к выбранной базе. |
||
Dialog.cpp |
Позволяет пользователю указать путь к подключаемой базе данных. Передаёт путь модулю Menu.cpp. |
|
Входные данные: путь к выбранной базе. |
||
Выходные данные: новый/измененный путь к выбранной базе. |
||
Имя файла |
Описание |
|
Fisher01.dat |
Содержит таблицу Фишера с допущением 0,1%. |
|
Входные данные: отсутствуют. |
||
Выходные данные: таблица Фишера с допущением 0,1%. |
||
Fisher05.dat |
Содержит таблицу Фишера с допущением 0,5%. |
|
Входные данные: отсутствуют. |
||
Выходные данные: таблица Фишера с допущением 0,5%. |
||
Fisher1.dat |
Содержит таблицу Фишера с допущением 1%. |
|
Входные данные: отсутствуют. |
||
Выходные данные: таблица Фишера с допущением 1%. |
||
Fisher25.dat |
Содержит таблицу Фишера с допущением 2,5%. |
|
Входные данные: отсутствуют. |
||
Выходные данные: таблица Фишера с допущением 2,5%. |
||
Fisher5.dat |
Содержит таблицу Фишера с допущением 5%. |
|
Входные данные: отсутствуют. |
||
Выходные данные: таблица Фишера с допущением 5%. |
||
Fisher10.dat |
Содержит таблицу Фишера с допущением 10%. |
|
Входные данные: отсутствуют. |
||
Выходные данные: таблица Фишера с допущением 10%. |
||
Analys.cfg |
Содержит настройки системы. |
|
Входные данные: измененные настройки системы для сохранения. |
||
Выходные данные: сохраненные настройки системы. |
||
Help.rtf |
Содержит справочную информацию. |
|
Входные данные: отсутствуют. |
||
Выходные данные: справочная информация по работе с системой. |
Структура программного обеспечения представлена на рис. 37.
Рис. 37. Структура программного обеспечения.
6.5.2 Краткая характеристика общего программного обеспечения
6.5.2.1 Операционная система
В проекте используется операционная система MS Windows 9x/NT/2000/XP. Главный аргумент в пользу выбора данной операционной системы (ОС) - её широкая распространённость.
ОС Windows предоставляет пользователю удобный графический интерфейс. Пользовательские интерфейсы различных прикладных программ включают в себя стандартные элементы, это обеспечивает единый принцип взаимодействия с пользователем. Многозадачность Windows позволяет одновременно выполнять несколько программ. Пользователь может переходить от одной задачи к другой. Предусмотрены средства, позволяющие программам обмениваться данными. ОС позволяет использовать всю имеющуюся оперативную и дисковую память как единый сегмент. Программы, выполняющиеся в Windows, не работают непосредственно с графическим оборудованием. Для графического вывода используется набор функций, предоставляемых средой. Действие функций едино для различных графических адаптеров. При работе в Windows программист не имеет прямого доступа к ресурсам системы: файлам, окнам и т.д. Вместо этого они используют способ, принятый в MS-DOS для работы с файлами: каждый ресурс идентифицируется уникальным целым числом - дескриптором, и доступ осуществляется с помощью встроенных API-функций.
6.5.2.2 Средства, расширяющие возможности операционной системы
Для организации доступа к базе данных, содержащей эталонные образы должна быть установлена системы управления базами данных Borland Database Engine (BDE). BDE представляет собой набор драйверов, реализованный в виде динамически подключаемых библиотек. Механизм BDE действует как интерфейс между приложением и базой данных. Взаимодействие с BDE не зависит от конкретной базы данных. BDE обращается к драйверам, специфическим для базы данных указанного типа, возвращая приложению запрошенную информацию.
База данных является локальной и работает под управлением СУБД локального типа - dBase для Windows, либо под управлением Microsoft Excel.
7. Исследование работоспособности и эффективности автоматизированной системы
7.1 Состав функций АС и перечень составляющих технического, программного, информационного и организационного обеспечений, выбранных для экспериментальной проверки
В ходе экспериментальной проверки проверяются все основные функции, выполняемые системой анализа технологических факторов производства продукции:
· функции, обеспечивающие ввод исходных данных, а также определение исходных данных для анализа;
· функции факторного анализа;
· функции дисперсионного анализа;
· функции, реализующие алгоритмы кластерного анализа;
· функции, обеспечивающие выдачу результатов работы, а также сообщений и помощи по программе.
Тестируется правильность организации информационного обеспечения АС анализа технологических факторов производства продукции, представляющего собой совокупность информации, состоящей из массивов данных, необходимых для выполнения всех функций подсистемы анализа технологических факторов производства продукции. Проверяется, насколько эффективно было спроектировано техническое и организационное обеспечение (п. 6.4. и п.6.1.4.).
Эффективность всего вышеописанного целиком и полностью проверяется в ходе тестовых запусков и проверок программного модуля подсистемы Analyse.exe.
7.2 Описание задач, поставленных перед экспериментальной проверкой АС
Экспериментальная проверка работы АС преследует следующие цели:
· проверить работоспособность всех компонент и обеспечения системы;
· выявить ошибки, допущенные на стадии концептуального проектирования (при проектирования структуры и состава обеспечения, описанных в п. 7.1);
· выявить ошибки и недочеты, допущенные в ходе реализации проекта;
· оценить эффективность работы созданной системы;
· сделать выводы о перспективах использования и развития системы.
Общий алгоритм проведения исследования следующий.
В соответствии с документами “Руководство оператора” и “Описание применения” подготовить подсистему к тестовому запуску и обеспечить ее входной информацией (см. п.7.3.). Далее для разных наборов выбранных факторов и выходных свойств запустить алгоритмы факторного, дисперсионного и кластерного анализов.
7.3 Описание входной информации, используемой при проведении исследований работоспособности и эффективности АС
Для подсистемы анализа технологических факторов производства продукции входными является массив экспериментальных данных технологии и выходных свойств.
В частности, при проведении исследований работоспособности автоматизированной системы анализа технологических параметров производства продукции, использовались массивы экспериментальных значений производства крахмала.
7.4 Анализ результатов экспериментальной проверки АС
В качестве анализа результатов экспериментальной проверки АС можно предложить:
· определить исходную выборку, произвести кластерный анализ и на основе новой выборки сократить исходную выборку методами факторного и дисперсионного анализов. Далее еще раз осуществить кластерный анализ, но уже с новыми данными. Таким образом можно проверить качество работы алгоритмов системы анализа технологических параметров производства продукции.
Контрольный пример (анализ затрат)
Исходные данные представлены в табл. 6.
Таблица 6. Исходные данные.
Марка стали |
входная толщина (мм) |
входная шиpина (мм) |
суммаpные затpаты (pуб/т) |
суммаpные затpаты (k(min)) |
|
08ГСЮТ |
2,30 |
1388,00 |
598,43 |
1,19188 |
|
08ГСЮТ |
2,30 |
1250,00 |
594,58 |
1,18422 |
|
08ГСЮТ |
2,20 |
1390,00 |
624,59 |
1,24398 |
|
08ГСЮТ |
3,00 |
1330,00 |
540,63 |
1,07677 |
|
08ГСЮТ |
3,90 |
1255,00 |
522,15 |
1,03997 |
|
08ГСЮТ |
3,90 |
1335,00 |
549,02 |
1,09348 |
|
08ГСЮТ |
4,20 |
1340,00 |
596,65 |
1,18834 |
|
08ПС |
2,50 |
1256,00 |
621,22 |
1,23727 |
|
08ПС |
2,30 |
1255,00 |
643,72 |
1,28209 |
|
08ПС |
2,43 |
1261,00 |
625,57 |
1,24595 |
|
08ПС |
2,38 |
1260,00 |
637,77 |
1,27024 |
|
08ПС |
2,59 |
1353,00 |
603,91 |
1,20280 |
|
08ПС |
2,66 |
1513,00 |
569,09 |
1,13345 |
|
08ПС |
2,70 |
1596,00 |
575,31 |
1,14584 |
|
08ПС |
3,28 |
1255,00 |
549,95 |
1,09533 |
|
08ПС |
3,14 |
1325,00 |
530,97 |
1,05753 |
|
08ПС |
3,00 |
1257,00 |
563,15 |
1,12161 |
|
08ПС |
3,22 |
1400,00 |
516,00 |
1,02771 |
|
08ПС |
3,22 |
1261,00 |
540,59 |
1,07669 |
|
08ПС |
3,36 |
1275,00 |
533,80 |
1,06317 |
|
08ПС |
3,90 |
1240,00 |
527,94 |
1,05148 |
|
08ПС |
3,90 |
1257,00 |
521,15 |
1,03796 |
|
08ПС |
3,00 |
1501,00 |
514,01 |
1,02375 |
|
08ПС |
3,06 |
1539,00 |
512,93 |
1,02159 |
|
08ПС |
3,53 |
1521,00 |
515,76 |
1,02723 |
|
08ПС |
3,90 |
1594,00 |
514,57 |
1,02486 |
|
08Ю |
2,30 |
1255,00 |
643,71 |
1,28206 |
|
08Ю |
2,40 |
1255,00 |
617,96 |
1,23079 |
|
08Ю |
2,36 |
1259,00 |
639,20 |
1,27308 |
|
08Ю |
2,70 |
1405,00 |
588,72 |
1,17255 |
Факторный анализ
Исходные данные для факторного анализа представляются в виде матрицы (табл. 7), где количество столбцов - количество факторов, а количество строк - количество экспериментов, объектов и т.п.
Таблица 7. Исходная матрица факторного анализа
2,300 |
1388,000 |
|
2,300 |
1250,000 |
|
2,200 |
1390,000 |
|
3,000 |
1330,000 |
|
3,900 |
1255,000 |
|
3,900 |
1335,000 |
|
4,200 |
1340,000 |
|
2,500 |
1256,000 |
|
2,300 |
1255,000 |
|
2,430 |
1261,000 |
|
2,380 |
1260,000 |
|
2,590 |
1353,000 |
|
2,660 |
1513,000 |
|
2,700 |
1596,000 |
|
3,280 |
1255,000 |
|
3,140 |
1325,000 |
|
3,000 |
1257,000 |
|
3,220 |
1400,000 |
|
3,220 |
1261,000 |
|
3,360 |
1275,000 |
|
3,900 |
1240,000 |
|
3,900 |
1257,000 |
|
3,000 |
1501,000 |
|
3,060 |
1539,000 |
|
3,530 |
1521,000 |
|
3,900 |
1594,000 |
|
2,300 |
1255,000 |
|
2,400 |
1255,000 |
|
2,360 |
1259,000 |
|
2,700 |
1405,000 |
Исходная таблица преобразуется в матрицу стандартизированных значений Z (табл. 8) см. п. 6.2.2.
Таблица 8. Матрица стандартизированных значений
-1,142 |
0,375 |
|
-1,142 |
-0,859 |
|
-1,308 |
0,393 |
|
0,020 |
-0,143 |
|
1,514 |
-0,814 |
|
1,514 |
-0,099 |
|
2,012 |
-0,054 |
|
-0,810 |
-0,805 |
|
-1,142 |
-0,814 |
|
-0,926 |
-0,761 |
|
-1,009 |
-0,769 |
|
-0,660 |
0,062 |
|
-0,544 |
1,493 |
|
-0,478 |
2,236 |
|
0,485 |
-0,814 |
|
0,253 |
-0,188 |
|
0,020 |
-0,796 |
|
0,386 |
0,483 |
|
0,386 |
-0,761 |
|
0,618 |
-0,635 |
|
1,514 |
-0,948 |
|
1,514 |
-0,796 |
|
0,020 |
1,386 |
|
0,120 |
1,726 |
|
0,900 |
1,565 |
|
1,514 |
2,218 |
|
-1,142 |
-0,814 |
|
-0,976 |
-0,814 |
|
-1,042 |
-0,778 |
|
-0,478 |
0,527 |
Матрица стандартизированных значений преобразуется в матрицу парных корреляций R (табл. 9) см. п. 6.2.2.
Таблица 9. Матрица парных корреляций
1,000 |
0,112 |
|
0,112 |
1,000 |
Применяя алгоритм Фадеева (см. п. 6.2.2.), получаются коэффициенты характеристического уравнения.
X2-2X+0,987=0
Используя корни характеристического уравнения (см. п. 6.2.2.), получается матрица собственных векторов (табл. 10).
Таблица 10. Матрица собственных векторов
1,000 |
-1,000 |
|
1,000 |
1,000 |
Далее получается матрица нормированных собственных векторов (см. п. 6.2.2.)
Таблица 11. Матрица нормированных собственных векторов
0,707 |
-0,707 |
|
0,707 |
0,707 |
В результате дальнейших преобразований получается матрица факторного отображения (табл. 12).
Таблица 12. Матрица факторного отображения
0,746 |
-0,666 |
|
0,746 |
0,666 |
Проверкой правильности работы факторного анализа является матрица главных компонент (табл. 13)
Таблица 13. Матрица главных компонент
-0,514 |
1,138 |
|
-1,341 |
0,212 |
|
-0,613 |
1,276 |
|
-0,082 |
-0,123 |
|
0,469 |
-1,748 |
|
0,949 |
-1,211 |
|
1,313 |
-1,551 |
|
-1,083 |
0,003 |
|
-1,311 |
0,246 |
|
-1,131 |
0,124 |
|
-1,192 |
0,180 |
|
-0,401 |
0,542 |
|
0,637 |
1,529 |
|
1,179 |
2,036 |
|
-0,221 |
-0,975 |
|
0,043 |
-0,331 |
|
-0,520 |
-0,613 |
|
0,582 |
0,073 |
|
-0,251 |
-0,860 |
|
-0,012 |
-0,941 |
|
0,380 |
-1,848 |
|
0,481 |
-1,734 |
|
0,943 |
1,025 |
|
1,238 |
1,205 |
|
1,653 |
0,499 |
|
2,502 |
0,528 |
|
-1,311 |
0,246 |
|
-1,200 |
0,121 |
|
-1,220 |
0,198 |
|
0,033 |
0,754 |
|
?=0 |
?=0 |
Дисперсионный анализ
Влияние фактора ' входная толщина (мм)' на свойство 'суммаpные затpаты (pуб/т)'
Исходные данные для дисперсионного анализа, представляются в виде таблиц (табл. 14, табл. 15, табл. 16, табл. 17)
Таблица 14. Разбиение по уровням.
Номера вариаций |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
|
Значения вариаций |
2,2 |
2,3 |
2,36 |
2,38 |
2,4 |
2,43 |
2,5 |
2,59 |
2,66 |
2,7 |
3 |
3,06 |
3,14 |
3,22 |
3,28 |
3,36 |
3,53 |
3,9 |
4,2 |
|
1 |
624,59 |
598,43 |
639,2 |
637,77 |
617,96 |
625,57 |
621,22 |
603,91 |
569,09 |
575,31 |
540,63 |
512,93 |
530,97 |
516 |
549,95 |
533,8 |
515,76 |
522,15 |
596,65 |
|
2 |
594,58 |
588,72 |
563,15 |
540,59 |
549,02 |
|||||||||||||||
3 |
643,72 |
514,01 |
527,94 |
|||||||||||||||||
4 |
643,71 |
521,15 |
||||||||||||||||||
5 |
514,57 |
Рис. 38. Гистограмма распределения факторов по уровням
Сумма квадратов между группами SSw=4536.623087; |
Средний квадрат между группами: MSw = 412.420281; |
|
Сумма квадратов внутри групп SSb=57537.667130; |
Средний квадрат внутри групп: MSb = 3196.537063; |
|
Число степеней свободы, связанное с SSw = 11; |
Отношение MSb/MSw = 7.750679; |
|
Число степеней свободы, связанное с SSb = 18; |
Значение из таблицы Фишера = 2.123000 < 7.750679. Фактор является значимым. |
Влияние фактора ' входная толщина (мм)' на свойство 'суммаpные затpаты (k(min))'
Таблица 15. Разбиение по уровням.
Номера вариаций |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
|
Значения вариаций |
2,2 |
2,3 |
2,36 |
2,38 |
2,4 |
2,43 |
2,5 |
2,59 |
2,66 |
2,7 |
3 |
3,06 |
3,14 |
3,22 |
3,28 |
3,36 |
3,53 |
3,9 |
4,2 |
|
1 |
1,244 |
1,1919 |
1,2731 |
1,2702 |
1,2308 |
1,2459 |
1,2373 |
1,2028 |
1,1335 |
1,1458 |
1,0768 |
1,0216 |
1,0575 |
1,0277 |
1,0953 |
1,0632 |
1,0272 |
1,04 |
1,1883 |
|
2 |
1,1842 |
1,1725 |
1,1216 |
1,0767 |
1,0935 |
|||||||||||||||
3 |
1,2821 |
1,0237 |
1,0515 |
|||||||||||||||||
4 |
1,2821 |
1,038 |
||||||||||||||||||
5 |
1,0249 |
Рис. 39. Гистограмма распределения факторов по уровням
Сумма квадратов между группами SSw=0.017995; |
Средний квадрат между группами: MSw = 0.001636; |
|
Сумма квадратов внутри групп SSb=0.228240; |
Средний квадрат внутри групп: MSb = 0.012680; |
|
Число степеней свободы, связанное с SSw = 11; |
Отношение MSb/MSw = 7.751051; |
|
Число степеней свободы, связанное с SSb = 18; |
Значение из таблицы Фишера = 2.123000 < 7.751051. Фактор является значимым |
1
Влияние фактора 'входная шиpина (мм)' на свойство 'суммаpные затpаты (pуб/т)'
Таблица 16. Разбиение по уровням.
Номера вариаций |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
|
Значения вариаций |
1240 |
1250 |
1255 |
1256 |
1257 |
1259 |
1260 |
1261 |
1275 |
1325 |
1330 |
1335 |
1340 |
1353 |
1388 |
1390 |
1400 |
1405 |
1501 |
1513 |
1521 |
1539 |
1594 |
1596 |
|
1 |
527,94 |
594,58 |
522,15 |
621,22 |
563,15 |
639,2 |
637,77 |
625,57 |
533,8 |
530,97 |
540,63 |
549,02 |
596,65 |
603,91 |
598,43 |
624,59 |
516 |
588,72 |
514,01 |
569,09 |
515,76 |
512,93 |
514,57 |
575,31 |
|
2 |
643,72 |
521,15 |
540,59 |
||||||||||||||||||||||
3 |
549,95 |
||||||||||||||||||||||||
4 |
643,71 |
||||||||||||||||||||||||
5 |
617,96 |
Рис 40. Гистограмма распределения факторов по уровням
Сумма квадратов между группами SSw=17101.649280; |
Средний квадрат между группами: MSw = 2850.274880; |
|
Сумма квадратов внутри групп SSb=44972.640937; |
Средний квадрат внутри групп: MSb = 1955.332215; |
|
Число степеней свободы, связанное с SSw = 6; |
Отношение MSb/MSw = 0.686015; |
|
Число степеней свободы, связанное с SSb = 23; |
Значение из таблицы Фишера = 2.818300 > 0.686015. Фактор не является значимым. |
Влияние фактора 'входная шиpина (мм)' на свойство 'суммаpные затpаты (k(min))'
Таблица 17. Разбиение по уровням
Номера вариаций |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
|
Значения вариаций |
1240 |
1250 |
1255 |
1256 |
1257 |
1259 |
1260 |
1261 |
1275 |
1325 |
1330 |
1335 |
1340 |
1353 |
1388 |
1390 |
1400 |
1405 |
1501 |
1513 |
1521 |
1539 |
1594 |
1596 |
|
1 |
1,0515 |
1,1842 |
1,04 |
1,2373 |
1,1216 |
1,2731 |
1,2702 |
1,2459 |
1,0632 |
1,0575 |
1,0768 |
1,0935 |
1,1883 |
1,2028 |
1,1919 |
1,244 |
1,0277 |
1,1725 |
1,0237 |
1,1335 |
1,0272 |
1,0216 |
1,0249 |
1,1458 |
|
2 |
1,2821 |
1,038 |
1,0767 |
||||||||||||||||||||||
3 |
1,0953 |
||||||||||||||||||||||||
4 |
1,2821 |
||||||||||||||||||||||||
5 |
1,2308 |
Рис. 41. Гистограмма распределения факторов по уровням
Сумма квадратов между группами SSw=0.067836; |
Средний квадрат между группами: MSw = 0.011306; |
|
Сумма квадратов внутри групп SSb=0.178399; |
Средний квадрат внутри групп: MSb = 0.007756; |
|
Число степеней свободы, связанное с SSw = 6; |
Отношение MSb/MSw = 0.686051; |
|
Число степеней свободы, связанное с SSb = 23; |
Значение из таблицы Фишера = 2.818300 > 0.686051. Фактор не является значимым |
Результат дисперсионного анализа представлен в табл. 18.
Таблица 18. Таблица значимости факторов на свойства (0-фактор незначим, 1-значим)
ФакторыСвойства |
суммаpные затpаты (pуб/т) |
суммаpные затpаты (k(min)) |
|
входная толщина (мм) |
1 |
1 |
|
входная шиpина (мм) |
0 |
0 |
Кластерный анализ
Метод К-средних.
Итерации решения представлены в табл. 19 и табл. 20.
Таблица 19. Расстояния между кластерами и точками
ТочкиКластеры |
1 |
2 |
3 |
4 |
5 |
|
1 |
0,3886 |
0,38747 |
0,42144 |
0,21468 |
0,04175 |
|
2 |
0,45239 |
0,45239 |
0,47816 |
0,29867 |
0,1185 |
|
3 |
0,059343 |
0,063094 |
0,071621 |
0,17277 |
0,37176 |
|
4 |
0,057928 |
0,07634 |
0,038081 |
0,23114 |
0,42759 |
|
5 |
0,02593 |
0,057231 |
0,04457 |
0,18929 |
0,38964 |
|
6 |
0,036504 |
0,069752 |
0,031206 |
0,21111 |
0,40659 |
|
7 |
0,045873 |
0,070556 |
0,085905 |
0,13854 |
0,34441 |
|
8 |
0,082564 |
0,094416 |
0,13499 |
0,092244 |
0,3203 |
|
9 |
0,065195 |
0,099832 |
0,13447 |
0,089472 |
0,31156 |
|
10 |
0,19376 |
0,24341 |
0,26982 |
0,068215 |
0,17232 |
|
11 |
0,1794 |
0,22308 |
0,25873 |
0,022153 |
0,20908 |
|
12 |
0,12466 |
0,17367 |
0,20224 |
0,048479 |
0,23896 |
|
13 |
0,20865 |
0,25077 |
0,28822 |
0,054397 |
0,1965 |
|
14 |
0,18737 |
0,23456 |
0,26527 |
0,021671 |
0,1879 |
|
15 |
0,22173 |
0,26946 |
0,29901 |
0,052123 |
0,1569 |
|
16 |
0,34393 |
0,39476 |
0,41738 |
0,17349 |
0,050205 |
|
17 |
0,34747 |
0,39766 |
0,4217 |
0,17489 |
0,04716 |
|
18 |
0,17304 |
0,20843 |
0,25269 |
0,057445 |
0,23319 |
|
19 |
0,18377 |
0,22098 |
0,26363 |
0,042569 |
0,21956 |
|
20 |
0,27063 |
0,31742 |
0,34818 |
0,095605 |
0,11109 |
|
21 |
0,35117 |
0,40071 |
0,4261 |
0,17264 |
0,046905 |
|
22 |
0,08846 |
0,07632 |
0,013081 |
0,273 |
0,42581 |
|
23 |
0,042854 |
0,043429 |
0,039343 |
0,22969 |
0,38949 |
|
24 |
0,074369 |
0,070776 |
0,014123 |
0,25756 |
0,40993 |
|
25 |
0,043117 |
0,095674 |
0,11418 |
0,14526 |
0,30806 |
Центры кластеров:1: (0,609;0,929). Ненормированные координаты: (2,5578;598,02)2: (0,54762;0,92366). Ненормированные координаты: (2,3;594,58)3: (0,553;0,985). Ненормированные координаты: (2,3226;634,06)4: (0,758;0,826). Ненормированные координаты: (3,1836;531,71)5: (0,941;0,837). Ненормированные координаты: (3,9522;538,79)
Итерация 1
Таблица 20. Расстояния между кластерами и точками
ТочкиКластеры |
1 |
2 |
3 |
4 |
5 |
|
1 |
0,061383 |
0,00598 |
0,055621 |
0,23452 |
0,40414 |
|
2 |
0,061612 |
0,0033615 |
0,061575 |
0,23194 |
0,40281 |
|
3 |
0,094665 |
0,050457 |
0,032692 |
0,27507 |
0,43796 |
|
4 |
0,13796 |
0,18728 |
0,21866 |
0,045852 |
0,22673 |
|
5 |
0,34061 |
0,39753 |
0,41666 |
0,17529 |
0,028692 |
|
6 |
0,32851 |
0,38753 |
0,40125 |
0,17648 |
0,022459 |
|
7 |
0,39101 |
0,452 |
0,45448 |
0,2655 |
0,11084 |
|
8 |
0,038587 |
0,06129 |
0,049602 |
0,21039 |
0,36979 |
|
9 |
0,088781 |
0,074001 |
0,017056 |
0,2693 |
0,42654 |
|
10 |
0,047298 |
0,055065 |
0,032382 |
0,22747 |
0,38775 |
|
11 |
0,069629 |
0,067398 |
0,016153 |
0,24882 |
0,40544 |
|
12 |
0,010527 |
0,069738 |
0,079043 |
0,17668 |
0,34129 |
|
13 |
0,055997 |
0,09508 |
0,129 |
0,13348 |
0,31411 |
|
14 |
0,047529 |
0,1002 |
0,12808 |
0,12963 |
0,30604 |
|
15 |
0,18168 |
0,24373 |
0,26275 |
0,038383 |
0,16432 |
|
16 |
0,16759 |
0,22378 |
0,25204 |
0,0093513 |
0,19841 |
|
17 |
0,11259 |
0,17398 |
0,19532 |
0,061308 |
0,23263 |
|
18 |
0,19694 |
0,25158 |
0,28159 |
0,033764 |
0,18354 |
|
19 |
0,17533 |
0,23505 |
0,25834 |
0,016814 |
0,17841 |
|
20 |
0,20966 |
0,26994 |
0,29201 |
0,046034 |
0,14585 |
|
21 |
0,3319 |
0,39502 |
0,41016 |
0,17191 |
0,029799 |
|
22 |
0,33542 |
0,39798 |
0,41451 |
0,1729 |
0,036393 |
|
23 |
0,16222 |
0,20954 |
0,24657 |
0,053669 |
0,23146 |
|
24 |
0,17267 |
0,22202 |
0,25736 |
0,041642 |
0,21775 |
|
25 |
0,25858 |
0,31799 |
0,3412 |
0,090241 |
0,10867 |
|
26 |
0,3391 |
0,40108 |
0,41894 |
0,17264 |
0,042792 |
|
27 |
0,099395 |
0,073981 |
0,015917 |
0,273 |
0,42581 |
|
28 |
0,054469 |
0,041275 |
0,031886 |
0,22969 |
0,38949 |
|
29 |
0,084857 |
0,068407 |
0,011325 |
0,25756 |
0,40993 |
|
30 |
0,031045 |
0,095547 |
0,11183 |
0,14526 |
0,30806 |
Состав кластеров:1-й кластер: 8; 12; 13; 14; 30; 2-й кластер: 1; 2; 3-й кластер: 3; 9; 10; 11; 27; 28; 29; 4-й кластер: 4; 15; 16; 17; 18; 19; 20; 23; 24; 25; 5-й кластер: 5; 6; 7; 21; 22; 26;
Результат работы метода к-средних представлен на рис. 42.
Рис. 42. График результата метода к-средних
Метод FOREL
Результат работы метода FOREL представлен на рис. 42.
Рис.43. График результата метода FOREL
Состав кластеров:
1-й кластер: 4;15;16;17;18;19;20;23;24;25;
Координаты кластера: 0,757;0,826;
2-й кластер: 1;2;3;8;9;10;11;12;13;14;27;28;29;30;
Координаты кластера: 0,580;0,952;
3-й кластер: 5;6;21;22;26;
Координаты кластера: 0,929;0,819;
4-й кластер: 7;
Координаты кластера: 1,000;0,927;
6. Метод KRAB
Итерации решения представлены в табл. 21.
Результат решения представлен на рис. 44.
Табл. 21. Итерация 29
Точки графаСвоб.точки |
7 |
|
1 |
0,20466 |
|
2 |
0,20466 |
|
28 |
0,18477 |
|
10 |
0,17962 |
|
8 |
0,16529 |
|
11 |
0,19186 |
|
29 |
0,1963 |
|
27 |
0,20999 |
|
9 |
0,20999 |
|
12 |
0,14707 |
|
30 |
0,1277 |
|
14 |
0,12865 |
|
13 |
0,13628 |
|
3 |
0,22864 |
|
17 |
0,084338 |
|
4 |
0,089204 |
|
16 |
0,074106 |
|
19 |
0,062028 |
|
15 |
0,053246 |
|
18 |
0,07014 |
|
20 |
0,049534 |
|
24 |
0,09059 |
|
23 |
0,098112 |
|
25 |
0,041237 |
|
26 |
0,021361 |
|
22 |
0,018859 |
|
5 |
0,018498 |
|
21 |
0,016496 |
|
6 |
0,010577 |
Рис. 44. График результата метода KRAB.
Библиографический список
1. Кузнецов Л.А., Ведищев В.В. Математическое моделирование сложных технологических процессов (на примере системы управления качеством проката). // Датчики и системы 2001 №9. С.10-13
2. Кузнецов Л.А., Корнеев А.М. Автоматизированная система выбора оптимальной технологии производства проката. //Известия ВУЗов. ЧМ 1994 №5. С. 45-49.
3. Загоруйко Н.Г., Ёлкина В.Н., Емельянов С.В., Лбов Г.С. Пакет прикладных программ ОТЭКС. - М.: Финансы и статистика, 1986. 241 с.
4. Кузнецов Л.А., Погодаев А.К., Бурцев В.Д. «Объектно-ориентированный подход к моделированию сложных систем». // Известия ВУЗов. Черная металлургия. 2001. №7. С. 55 - 58.
5. Кузнецов Л. А. «Современный подход к управлению металлургической технологией (Часть I)» // Производство проката. 1999. №9. С. 4-7.
6. Кузнецов Л. А. «Современный подход к управлению металлургической технологией (Часть II)» // Производство проката. 2000. №3. С.5-8.
7. Барабаш И., Лукинский С. «Из опыта автоматизации спиртового производства» // Современные технологии автоматизации. 1998. №3. С. 41-43.
8. Кузнецов Л.А., Ведищев В.В., Комаров В.В. Система моделирования технологии производства проката //Датчики и системы 2001 №4. С 2-7.
9. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: исследование зависимостей: Справ. изд. М.: Финансы и статистика,1985. 353 с.
10. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере. М.:ИИФРА, 1998. 526 с.
11. Гайдышев И. Анализ и обработка данных: специальный справочник - СПб: Питер, 2001. 752 с.
12. Мюллер П., Нойман П., Шторм Р. Таблицы по математической статистике. - Финансы и статистика, 1982. 278 с.
13. Ликеш И., Ляга Й. Основные таблицы математической статистики.- М.:Финансы и статистика, 1985, 356 с.
14. Петров А.П. Статистическая обработка результатов экспериментальных исследований: Учебное пособие. - Курган: Издательство Курганского гос. ун-та, 1998. 85 с.
15. Холлендер М., Вулф Д. Непараметрические методы статистики. - М.: Финансы и статистика, 1983. 518 с.
16. Рунион Р. Справочник по непараметрической статистике. - М.:Финансы и статистика, 1982. 198 с.
17. Плохинский Н.А. Основные вопросы в биометрии //Биометрический анализ в биологии. - М.:Издательство Московского университета. - 1982. С. 7-11.
18. Дюран Б., Одел П. Кластерный анализ, М: Статистика, 1977. 318 с.
19. Гайдышев И. Анализ и обработка данных: специальный справочник, СПб: Питер, 2001. 412 с.
20. Стратонович Р.Л. Теория информации. М.:Советское радио, 1975 424 с.
21. Кузнецов Л.А. // Известия ВУЗов. ЧМ 1989 №3. С 82-84.
22. Корнеев А.М., Яриков А.В. Исследование метода автоматизированного выбора оптимальной технологии. - В кн.: Математическое и информационное обеспечение автоматизированных систем. Сборник научных трудов. - Липецк, ЛГТУ, 1997. С.61-65
23. Кузнецов Л.А., Корнеев А.М. Критерий оценки связи технологии и выходных свойств. - В кн.: Теория и практика производства проката: Сборник научных трудов Международной научно-технической конференции. - Липецк: ЛГТУ, 2001. С.408-413.