Введение
Одной из важных проблем в области системного анализа является исследование динамики функционирования сложных технических и экономических систем на различных этапах их проектирования, испытания и эксплуатации. Система представляет собой совокупность каких-либо объектов, функционирующих и взаимодействующих между собой для достижения определенной цели [8]. Фактором повышения сложности системы является наличие у этой системы таких свойств, как большое число и неоднородность ее объектов, динамичность и стохастичность процессов взаимодействия объектов, отсутствие унифицированного математического формализма для описания любого объекта системы с требуемой степенью детализации его свойств и невозможность проведения полномасштабных натурных экспериментов с этой системой. Зачастую в процессе комплексного анализа сложных систем возникают задачи исследования отдельных видов оборудования и аппаратуры, входящих в их инфраструктуру, а также технологических процессов эксплуатации этих устройств. В этом случае применение имитационного моделирования позволит качественно решить эти задачи.
Создание и исследование имитационных моделей сложных систем требует значительных усилий высококвалифицированных специалистов, а их выполнение – ресурсоемких вычислений. В числе сложностей, возникающих перед исследователем при алгоритмизации логики функционирования исследуемой системы, можно выделить: выбор языка или системы программирования и программно-аппаратной платформы для проведения вычислительного эксперимента, тем более, если речь идет о распределенной вычислительной среде, разработка и реализация модели исследуемой системы, планирование и проведение вычислительного эксперимента, анализ результатов моделирования. Эффективное выполнение вышеперечисленных работ обоснованно требует применения средств их автоматизации [4].
В этих целях авторами разработан программный комплекс поддержки проведения вычислительного эксперимента для имитационных моделей, реализованных на языке GPSS [10]. Данный комплекс включает инструментальные средства построения имитационных моделей на основе шаблонов типовых объектов исследуемых систем, подготовки и проведения вычислительных экспериментов с имитационными моделями. Средства построения имитационных моделей достаточно детально рассмотрены в работе [6]. В данной статье представлены средства подготовки и проведения вычислительных экспериментов и приведены примеры их применения в процессе решения практических задач.
Вычислительная среда
Программный комплекс ориентирован на вычислительные кластеры, организованные на базе персональных компьютеров учебно-образовательных и научных организаций. Такие кластеры должны работать по управлением OS Windows и на них должна быть установлена система управления прохождением задач (СУПЗ) Condor [5]. Данная система обладает следующими преимуществами: ориентируется на объединение совокупности персональных компьютеров в единый вычислительный кластер на базе любой имеющейся локальной сети, что требует минимальных финансовых и временных затрат; функционирует под управлением различных операционных систем, включая ОС Windows; распространяется свободно, с открытым кодом. Для организации удаленного доступа к вычислительному кластеру используется веб-интерфейс, реализованный на языке PHP.
Использование вычислительных кластеров, организованных на базе персональных компьютеров, имеет высокую практическую значимость прежде всего для проведения многовариантных расчетов и вследствие этого позволяет выполнять имитационное моделирование с большой эффективностью.
Методика проведения вычислительного эксперимента
Процесс выполнения вычислительного эксперимента с использованием кластера под управлением СУПЗ Condor состоит из нескольких основных этапов:
1. Подготовка исходных данных, необходимых для проведения эксперимента. Пройдя авторизацию для доступа к вычислительному кластеру, пользователь попадает на главную страницу проекта, где он должен выбрать модель GPSS и, если необходимо, задать нужное количество дополнительных файлов и/или файлов с вариантами исходных данных. Он может задать до четырех дополнительных файлов и до шестнадцати файлов с вариантами. Также на главной странице отображена история ранее запущенных заданий с возможностью просмотра отчетов по каждому заданию.
2. Планирование числа прогонов модели для перехода в рабочий режим и функционирования непосредственно в рабочем режиме.
3. Подготовка паспорта задания, включающего информацию о прикладной программе, входных/выходных данных и др. После нажатия кнопки «Запустить задание» формируется паспорт задания, который передается управляющему узлу Condor, а пользователь попадает на страницу «запуск задания». На этой странице представлена информация о состоянии запущенного задания: id задания, время запуска, текущее состояние статуса задания (не выполняется, выполняется, приостановлено). Пользователь также имеет возможность удалить запущенное им задание из очереди.
4. Постановка задания в очередь СУПЗ.
5. Выполнение задания на свободных вычислительных узлах и передача результатов моделирования на машину, с которой производился запуск.
6. Сбор отчетов и результатов, полученных в ходе проведения вычислительного эксперимента. После того как задание будет выполнено, пользователь может посмотреть отчет, который состоит из двух файлов GPSS World: журнала задания (.sim) и отчета (.grp). Если было запущено многовариантное задание, то такие отчеты формируются для каждого варианта. Также пользователь может посмотреть лог-файл Condor, чтобы отследить выполнение задания на кластере.
7. Анализ полученных данных средствами дисперсионного анализа. В программном комплексе реализованы средства проведения дисперсионного анализа (рис. 1), которые в отличие от стандартных средств GPSS World [3] позволяют использовать неограниченное число факторов и их уровней, обеспечивают возможность параллельного проведения частичного факторного эксперимента, автоматизацию процессов его планирования и выполнения.
Проведение анализа в программном комплексе организовано по следующей схеме:
1. Для каждого уровня значений факторов формируется текстовый файл, представляющий собой вариант прогона модели. В файле каждому фактору присваивается соответствующее значение уровня. Если значения уровня для фактора не определено пользователем, то ему присваивается значение первого уровня.
2. Формируется паспорт многовариантного задания с количеством вариантов, равным количеству уровней, и запускается на кластере.
3. Из полученных по каждому варианту прогона модели отчетов извлекается значение наблюдаемой переменной и присваивается соответствующему элементу матрицы. Элемент матрицы определяется исходя из сочетания значений факторов. Первый элемент всегда [1,..,1], где число единиц соответствует количеству заданных факторов, а сама единица означает первый уровень значений фактора. У последующих элементов матрицы меняются значения в соответствии с изменением уровня. Если для фактора не указано значение уровня, то по умолчанию берется единица (первый уровень).
4. Полученная в результате экспериментов матрица передается процедуре ANOVA [3] для проведения дробного факторного эксперимента. Процедура формирует отчет и выводит результаты в виде таблицы.
Вычислительные эксперименты
Тестирование программного комплекса проводилось на вычислительном кластере, созданном на базе персональных компьютеров. Основные характеристики кластера: 8 вычислительных узлов; 8 двухъядерных процессоров Pentium DUAL-CORE 2.0 ГГц; объем оперативной памяти каждого узла – 500 Мб; объем дискового пространства – 80 Гб; операционная система Windows XP; СУПЗ Condor версии 6.6.8. Все программные модули установлены на управляющий узел. Система имитационного моделирования GPSS World Student Version установлена на каждый узел кластера, в том числе и управляющий.
Задача 1. Модель работы планировщика GridWay. В рамках первого вычислительного эксперимента было проведено моделирование работы планировщика GridWay в вычислительной среде, включающей 50 кластеров (1000 вычислительных узлов). Моделирование выполнялось с целью исследования эффективности и надежности вычислений при использовании данного планировщика в интегрированной кластерной системе [9]. Решение подобных задача имеет важное практическое значение при испытании и оценке надежности интегрированных кластерных систем. Планировщик GridWay распределяет поток задач, который состоит из заданий пяти типов: стандартные непараллельные и параллельные задания, многовариантные, взаимосвязанные и требующие установленного ПО в вычислительных узлах. Задания поступают в систему через случайные интервалы времени и встают в общую очередь. Через некоторый интервал планирования из очереди извлекается определенное количество задач и для них составляется расписание в зависимости от типа и требований к ресурсам. Задачи отправляются на узлы, где встают в локальные очереди этих узлов согласно расписанию. Моделировалась работа планировщика для трех алгоритмов планирования с разным соотношением типов задач.
Задача 2. Модель процесса погрузочно-разгрузочных работ. Второй вычислительный эксперимент был проведен для моделирования процесса погрузочно-разгрузочных работ на ООО «Иркутский Хладокомбинат» [2, 6]. Данная задача относится к актуальному направлению исследований в области логистики [1]. Исследуемый складской комплекс осуществляет операции с входными и выходными материальными потоками, как по плановым, так и по случайным заявкам. Плановые заявки формируются каждые сутки и содержат информацию о времени поступления/убытия груза, о его объеме. Случайные заявки поступают с различной интенсивностью, поступление/убытие транспортных средств той или иной грузоподъемности подчинено определенному вероятностному распределению. Обслуживание заявок осуществляется с помощью кар, грузчиков и кладовщиков. Имитировалась работа складского комплекса в течение 1 месяца. Прогон модели осуществлялся на кластере невыделенных рабочих станций под управлением СУПЗ Condor.
Также был проведен дисперсионный анализ полученных результатов для определения значимых факторов и оценки их влияния. В качестве наблюдаемых переменных были выбраны коэффициенты полезного использования грузчиков, кладовщиков и кар на отгрузке и разгрузке, а также проходимости по плановым и случайным заявкам. На рис. 2 и 3 представлены соответственно зависимость времени проведения экспериментов от количества вариантов исходных данных для автоматизированного и неавтоматизированного моделирования и сравнение временных затрат для автоматизированного и неавтоматизированного моделирования на разных этапах проведения вычислительных экспериментов, в том числе и на этапе анализа. Оценки времени моделирования получены в соответствии с методикой, представленной в работе [7].
Рис. 2. Время моделирования
Рис. 3. Сравнение временных затрат на разных этапах проведения эксперимента
С увеличением вариантов прогона модели разница между временем моделирования для автоматизированного и неавтоматизированного моделирования растет. Отсюда можно сделать вывод, что применение программного комплекса поддержки распределенного вычислительного эксперимента тем эффективнее, чем для большего количества вариантов модели нужно провести эксперимент.
Применение средств автоматизации вычислительного эксперимента позволило в значительной степени сократить трудозатраты на проведение имитационного моделирования, особенно на этапах подготовки исходных данных, формирования паспортов заданий, сбора и анализа полученных данных, что позволяет сделать вывод об эффективности использования данного инструментального комплекса для решения подобных задач.
Выводы
В статье предложены средства и приведена методика автоматизации проведения имитационного моделирования для GPSS моделей с использованием кластера под управлением СУПЗ Condor. Разработанное программное средство позволяет запускать задания, в том числе и многовариантные, а также проводить дисперсионный анализ модели, используя неограниченное число факторов и их уровней. В дальнейшем возможно расширение функционала программного комплекса путем реализации инструментов проведения регрессионного анализа.
Принципы работы, методика применения, способы и средства реализации рассмотренных инструментов обеспечивают широкий спектр использования их функциональных возможностей для имитационного моделирования сложных систем в самых различных сферах деятельности.
Рецензенты:
Аршинский Л.В., д.т.н., заведующий кафедрой «Информационные системы и Защита информации» Иркутского государственного университета путей сообщения, г. Иркутск.
Опарин Г.А., д.т.н., профессор, заместитель директора по научной работе Института динамики систем и теории управления СО РАН, г. Иркутск.