Читать книгу Методология построения распределенных сетей передачи, обработки и хранения данных: анализ и выбор рациональной структуры. Том 1 - Александр Юрьевич Чесалов - Страница 7
Глава 1
Анализ проблем повышения эффективности функционирования региональной сети передачи, обработки и хранения данных (РСХД): Аналитический обзор и Постановка задачи
1.3 Обзор математических методов проектирования распределенных вычислительных сетей
ОглавлениеПроектирование РСХД является сложной и комплексной задачей, решение которой можно разбить на следующие основные этапы (рис. 6):
– Обследование.
– Составление и утверждение технического задания.
– Технический проект.
– Рабочий проект.
– Монтаж оборудования.
– Опытное функционирование или тестирование работы аппаратно-программных комплексов.
– Приемочные испытания.
– Обучение и поддержка (сервис).
– Эксплуатация.
– Оптимизация и модернизация.
Одним из наиболее значимых этапов является этап технического проекта (ТП). Полученные результаты в ходе его разработки (анализа и синтеза исходных данных, определение топологии, построение модели, оценка показателей эффективности и т.д.) являются ключевыми при проектировании и создании РСХД. Количество подэтапов ТП должны быть четко описаны и жестко регламентированы в техническом задании (ТЗ), так окончание каждого из них является логическим началом следующего, а завершение технического проекта является началом рабочего проекта.
Рисунок 6. Основные этапы и алгоритм проектирования региональной распределенной вычислительной сети
После анализа факторов, определяющих выбор аппаратно-программного обеспечения и нацеленных на повышение эффективности функционирования, выполняется определение и выбор топологии РСХД. В результате чего должна быть создана структура, обеспечивающая оптимальную передачу заданных потоков информации по всем направлениям информационного обмена. Сложность этой задачи для региональной сети заключается не только в значительном объеме вычислений, но и в ограниченных возможностях определения исходных объемов передаваемой информации, потоки которой возрастают в ходе эксплуатации сети [29,30,31,32,33].
Наиболее часто используемый подход к решению данной проблемы заключается в теоретическом разбиении имеющейся сети на более простые структурные образования – структуру минимальной сети, анализе каждого из них и получении агрегированных характеристик сети композицией показателей простых структур [34].
Как известно топология сети существенно влияет на надежность, гибкость, пропускную способность, стоимость сети и передаваемого по ней трафика, время ответа, и определяется способом соединения ее узлов каналами связи. На практике используются четыре базовые топологии: шинная, кольцевая, звездообразная, древовидная (иерархическая).
В работе [35] применение методов многокритериальной оптимизации, теории нечетких множеств (при совместном учете показателей количественного и качественного характера), алгоритмов дискретного математического программирования, основанные на точных методах позволяют построить топологические схемы распределительных сетей и выбрать оптимальное решение для конкретной задачи. Они выбираются по нескольким критериям. При этом решение локально-оптимальное по любому из названных критериев принадлежит области Парето.
Настоящий алгоритм обеспечивает отыскание оптимального числа линий, отходящих от источника питания при учете ряда ограничений. При этом процесс оптимизации может начинаться из любого узла сети.
Автором подчеркивается, что получаемые по частным критериям схемы являются локально-оптимальными вариантами построения распределительных сетей. В общем случае указанные варианты не охватывают все альтернативы, принадлежащие области Парето. В связи с этим возникает необходимость «размножения» вариантов схем распределительных сетей. Для этой цели используются следующие подходы:
– формирование схем распределительных сетей осуществляется экспертом или в результате применения существующих традиционных алгоритмов выбора конфигурации сетей;
– формирование схем распределительных сетей осуществляется исходя из учета объективно существующей неопределенности исходной информации.
Последние варианты также должны принадлежать области Парето, т.е. необходима их проверка принадлежности к этой области. Для выбора окончательного решения в работе предлагается два взаимно дополняющих друг друга пути анализа.
Первый из них ориентирован на формирование и анализ модели однокритериального выбора среди схем, равноценных по показателям надежности электроснабжения и качества электроэнергии.
Второй подход связан с построением и анализом модели многокритериального выбора, обеспечивающего учет показателей как количественного, так и качественного характера.
Использование данного математического аппарата позволило автору решить следующие задачи:
– провести критический анализ существующих проблем проектирования и реконструкции распределительных электрических сетей среднего напряжения;
– разработать адекватную математическую модель для оценки и оптимизации надежности распределительных электрических сетей;
– провести анализ формальных и неформальных методов дискретной оптимизации и дать рекомендации о целесообразности использования для целей оптимизации надежности эвристических методов;
– разработать методы и алгоритмы для оптимизации как однородных, так и неоднородных средств повышения надежности в воздушных распределительных электрических сетях;
– разработать методы и алгоритмы комплексной многокритериальной оптимизации схем распределительных электрических сетей с учетом различных количественных и качественных критериев;
– реализовать возможность учета при выборе схем распределительных электрических сетей неопределенности целей и исходной информации.
Сложность синтеза вычислительных сетей с учетом всего диапазона взаимосвязанных вопросов такова, что оптимизация по одному комплексному критерию практически не возможна или приводит к неоправданным вычислениям и временным затратам. И как следствие, применение подхода комплексной оптимизации параметров вычислительной сети для проектирования РСХД на сегодняшний день неоправданно.
Несмотря на это, многие авторы используют обобщенные показатели оценки эффективности функционирования вычислительных сетей. Методы исследования в данных работах базируются на результатах теории сетевых моделей вычислительных сетей, теории оптимизации, теории баз данных, теории графов и теории представления знаний.
Другой подход к определению топологии сети предложен в работе [36]. В ней рассматривается класс иерархических структур, как наиболее общий, объединяющий в своем составе распределенные, и древовидные структуры. При использовании такой сети снижаются общая протяженность каналов сети, эффективно используется узловое оборудование и каналы сети, упрощается процедура управления сети и достигается определенная экономия ресурсов сети и т. д.
Больший вклад в разработку теоретических основ анализа и конструктивного метода оптимизации структуры РСХД с коммутацией пакетов, организованных по иерархическому принципу, предназначенных для решения широкого класса прикладных структурно-сетевых задач, отличавшихся различными факторами, подходами и методами расчетов вероятностно-временных характеристик был сделан в работе [37].
Рассматриваемые в работе задачи решались с помочью методов теории вероятностей, теории массового обслуживания, теории графов и математического программирования.
После окончания разработки и выбора оптимальной топологии сети следующими подэтапами технического проекта являются разработка математической модели или комплекса моделей, моделирование и определение или оптимизация показателей эффективности функционирования.
Применение общей теории систем, методов математического программирования, теории множеств, математической статистики и имитационного моделирования позволяют разработать модели и методы комплексной оптимизации параметров вычислительной сети, которые учитывают взаимосвязь основных сетевых механизмов, в условиях многокритериальности и неопределенности ресурсных и критериальных ограничений.
В работе [38] автором предложена модель анализа пропускной способности функциональной подсистемы, в основу которой положен информационный подход к анализу процессов обслуживания входных требований в функциональных подсистемах вычислительных сетей и сетей обмена данными (СОД). Суть предлагаемого подхода заключается в представлении процесса обслуживания входных требований как процесса кодирования. Поток информации, связанный с распределением внешних событий на множестве входов функциональной подсистемы сети обмена данными, в этом случае представляется в виде последовательности кодовых символов, принадлежащих пространству элементов соответствующей функциональной подсистемы. Тогда функциональная подсистема СОД может рассматриваться как информационный канал, для которого можно определить информационную пропускную способность.
Таким образом, вычислив информационную пропускную способность функциональной подсистемы СОД, рассматриваемую как информационный канал, можно определить пропускную способность подсистемы. Предложенная автором модель и метод оптимизации пропускной способности СОД может быть использован для решения задач управляющих элементов двухуровневой иерархической системы управления синтезом параметров СОД.
В результате проведенных исследований, постановки задачи, разработке методов комплексной оптимизации параметров СОД, позволяющих учесть взаимосвязь основных сетевых механизмов в условиях многокритериальности и неопределенности ресурсных и критериальных ограничений, автором разработана информационная модель пропускной способности и модель распределения потоков информационного обмена в функциональной подсистеме СОД. Предложена процедура синтеза оптимального координирующего сигнала, использующая указанные модели, предложена модель и план распределения разрешений в СОД при реализации метода ограничения нагрузки.
К достоинствам предложенного подхода можно отнести то, что решение поставленных задач напрямую зависит от изменения начальных условий, определяемых для каждого блока оптимизации и можно получать различные решения, управляя процессом параметрического синтеза.
К недостаткам – сложность выбора критериальных ограничений или ограничения на используемые ресурсы, а также сложность разработанных методов и подходов не позволяют быстро и объективно принять решения при анализе проектируемой или модернизируемой сети.
В работе [39] автором предлагается вероятностно-математическая модель процесса функционирования вычислительной системы, базирующаяся на основе теории массового обслуживания, также приводится оценка степени ее адекватности. На основе анализа известных методов управления доказывается, что динамические свойства системы управления потоками существенно зависят от структурной устойчивости оптимальных решений. Предложен подход к проектированию оптимальных вычислительных сетей, учитывающий явления структурной неустойчивости. Исследованы формы потери устойчивости оптимальных решений и предложены способы оценки критических значений управляющих параметров. Разработаны алгоритмы вычислительной сети, явно учитывающие явление структурной устойчивости оптимальных решений, возникающее при изменении характеристик внешней среды и изменении параметров входных потоков. На основании имитационной модели проведено экспериментальное исследование алгоритмов и исследованы их характеристики для различных типов сетей и проведен сравнительный анализ экспериментальных данных с результатами исследования.
Использование теории массового обслуживания (ТМО), теории марковских процессов позволяют рассмотреть теоретические аспекты разработки методов и алгоритмов управления информационными потоками в проектируемых телекоммуникационных сетях, а также позволяют учесть взаимосвязь основных сетевых механизмов, процессов передачи данных в условиях использования разнородных каналов связи.
В работе [40] представлен метод применения оптимального правила предоставления общих сетевых ресурсов (алгоритм оптимальной диспетчеризации), применение которого повышает качество функционирования сети. Как результат, делается вывод, что правилом разрешения конфликтов, когда на один ресурс претендует несколько процессов, является правило, в соответствии с которым при возникновении конфликта ресурс предоставляется конфликтующему процессу, имеющему минимальную вероятность попадания в активное состояние. Делается вывод о том, что при возникновении конфликта следует отдавать предпочтение тому из конфликтующих процессов, который реже вступает в конфликт с другими процессами.
В качестве оптимального правила предлагается использовать правило, минимизирующее среднюю частоту конфликтов.
Хотелось бы подчеркнуть, что к достоинствам изложенной в [30] методики определения характеристик вычислительной сети (ВС) можно отнести то, что она может быть положена в основу, и использоваться при разработке:
– методов применения оптимального правила предоставления общих сетевых ресурсов, разделения информационных потоков в узлах сети и улучшения качественных характеристик сетей;
– алгоритмов оптимального распределения информационных потоков;
– проектировании типовых структур региональных вычислительных сетей.
К недостаткам относится то, что в ней не раскрываются и не приводятся расчеты наиболее значимых параметров, определяющие эксплуатационные характеристики сети, такие как длина кадра и ширина окна линейного протокола, длительность сквозного тайм-аута на транспортном уровне управления сетью. Не делается упор на оптимизацию параметров функционирования ВС. Так как при разработке приложений, создании и эксплуатации сети важным является знание и прогноз пределов изменения операционных показателей пропускной способности и сетевой задержки в различных нагрузочных условиях.
Необходимо отметить, что основополагающим в теории массового обслуживания является аппарат теории марковских процессов. Вместе с тем имеется возможность дальнейшего развития теоретических работ в направлении анализа и исследования функционирования сетей.
В работе [30] доказана возможность использования теории гиббсовских состояний на счетных множествах, разработанной для описания биологических полей, применительно к информационно-вычислительным системам.
Сделан вывод, что рассмотрение случайных полей, обладающих потенциалом ближайшего соседа, является эквивалентным рассмотрению марковских полей. Данное теоретическое положение позволяет в более компактной, лаконичной форме задавать информацию о состоянии телекоммуникационной сети.
Применение методов базирующихся на использовании ТМО позволило автору решить следующие задачи:
– исследовать аналитическими средствами различные модели локальных и глобальных вычислительных сетей,
– рассчитать основные характеристики: вероятность занятости канала, среднюю скорость обслуживания заявок, среднюю производительность сети, пропускную способность, среднее время пребывания заявок в системе, вероятности потери пакетов, коэффициенты загрузки станции и общего канала,
– решить задачу минимизации общей задержки пакетов сообщений и установления оптимального маршрута прохождения сообщений, с целью нахождения оптимального распределения потоков,
– решить задачу выбора времени отправления квитанций с оптимальным упреждением момента начала блокировки пакетов из-за отсутствия мест в буферной памяти при анализе адаптивного децентрализованного, гибридного и иерархического алгоритмов маршрутизации,
– при использовании теории Марковских процессов принятия решений применительно к глобальным сетям найти оптимальную стратегию доступа к цифровым сетям интегрального обслуживания.
Практическая значимость применения методов исследования базирующихся на использовании теории массового обслуживания, марковских процессов, методах математического моделирования, теории гиббсовских состояний на счетных множествах заключается:
– в возможности выполнения условия обеспечения свободной и эффективной маршрутизации потоков сообщений в глобальных гетерогенных сетях, что особенно критично, как для Тверского региона в целом, так и для России, имеющей огромную территорию;
– в разработке методов применения оптимального правила предоставления общих сетевых ресурсов, разделения информационных потоков в узлах сети и улучшения качественных характеристик сетей;
– разработке алгоритмов оптимального распределения информационных потоков;
– проектировании типовых структур региональных сетей телекоммуникаций;
– проектировании региональных сетей телекоммуникаций;
– разработке коммуникационных профилей по функциям маршрутизации, коммутации и ретрансляции.
Дополнение ТМО методами теории вероятностей, теории расписаний позволяют разработать модели информационного переноса данных в сетевых структурах, отличающихся учетом дискретного характера функционирования управляющих протоколов:
– потоковые, позволяющие исследовать предельные возможности магистралей передачи данных, управляемых протоколами канального и сетевого уровня, и оптимизировать сетевую структуру и протокольные параметры по нагрузочному критерию;
– конвейерные, дающие возможность изучать влияние структурных неоднородностей передающей среды и потока данных на вероятностно-временные характеристики качества функционирования протокола транспортного уровня и синтезировать протокольные параметры по критерию, ориентированному на потребительские показатели.
Разработанные в [41] модели фрагментов сети с коммутацией пакетов, позволяют проводить сопоставительный анализ управляющих протоколов и расчет операционных характеристик отдельных звеньев передачи данных, многозвенных виртуальных каналов и средние показатели эффективности функционирования всей сети.
При разработке вопросов построения моделей нормальных и асинхронных протокольных процедур управления звеном передачи данных и оптимизации пропускной способности линейных соединений, показатель эффективности функционирования звена передачи данных определяется в виде отношения среднего объема данных, передаваемых при полной нагрузке, к среднему времени между поступлениями двух последовательных квитанций:
В асинхронном режиме работы линейного соединения размер окна влияет, главным образом, на вероятность получения квитанции за время передачи эшелона кадров. Требуемое значение при этом может быть найдено по заданной вероятности непроизводительных простоев.
На базе того же математического аппарата автор приводит детальный анализ других моделей и результатов исследований, которые позволяют:
– выделить наиболее важные факторы, эффекты и структурные особенности различных уровней управления транспортировкой данных, определяющие операционные характеристики подсети связи;
– получить аналитические опенки оптимальных по критерию пропускной способности межузловых соединений значений длины кадра и ширины окна, имеющие содержательно хорошо интерпретируемую зависимость от параметров протокола, характеристик звена передачи данных и вида трафика;
– найти аналитическую оценку нижней границы пропускной способности многозвенного тракта;
– получить оценки оптимальных значений сетевых параметров, обеспечивающих минимальное среднее время доставки сообщений пользователей по виртуальным соединениям при несущественном отклонении потенциальной пропускной способности межузловых соединений от максимального значения и т. д.
Концептуальная и математическая четкость построений, эффективные методы и алгоритмы, применение высокопроизводительных ЭВМ для решения задач большой размерности привели к широкому использованию моделей одно – и многопродуктовых сетей в исследовании операций.
В своих работах специалисты ВЦ РАН рассматривают ряд методов и подходов к решению задач по проблеме анализа многопользовательских сетевых систем с учетом неопределенности.
В рамках развития и применения общей методологии исследования операций ими предлагаются методы и рассматриваются задачи, которые могут быть использованы при проектировании РСХД:
– Многокритериальная, или параметрическая, постановка для неизвестных требований [42]. Рассмотрены два подхода к анализу эффективности многопользовательских сетевых систем с неизвестными требованиями пользователей: параметрический, где параметром является вектор входной нагрузки (вектор требований), и многокритериальный, где критериями являются величины пропускаемых по сети потоков (вектор мультипотока). Даны формальные постановки задачи анализа. Для обеих постановок предложен единый способ аппроксимации множества, являющегося решением. Разработаны алгоритмы аппроксимации. Обсуждаются различные процедуры организации вычислений.
– Задача о допустимости со случайными требованиями [43]. Рассмотрена задача анализа эффективности многопользовательских сетевых систем со случайными требованиями пользователей. Предложен ряд вероятностных и стохастических формулировок существующей задачи о допустимости многопродуктовых потоковых сетей. Исследованы постановки, учитывающие возможную не информированность (неполную или неточную информированность) о функции распределения вектора входной нагрузки – вектора требований. Обсуждаются методы решения возникающих задач стохастической оптимизации.
– Задача о допустимости при неслучайных потерях пропускной способности [44]. Рассмотрена задача анализа эффективности многопользовательских сетевых систем в условиях возможности неслучайных внешних воздействий, уменьшающих пропускную способность ребер физического графа сети. Предложена формулировка соответствующей задачи о допустимости многопродуктовых потоковых сетей для известного вектора требований. Исследована параметрическая постановка, учитывающая не информированность (неполную или неточную информированность) о векторе требований. В данном случае, задача представлена, как многокритериальная минимаксная с вектором величин потоков продуктов (мультипотоком) в качестве максимизируемого критерия. Проведена формализация решения задачи и указаны методы поиска решения.
– Задача нормативного анализа уязвимости многопродуктовой потоковой сети [45]. Рассмотрена задача анализа эффективности многопользовательских сетевых систем в условиях возможности неслучайных внешних воздействий, уменьшающих пропускную способность ребер физического графа сети. Вектор требований предполагается известным (трактуется, как заданный норматив, например, исходно пропускаемый по сети поток). Поставлена задача нормативного анализа уязвимости – получения гарантированных оценок качества функционирования сетевой системы, когда это качество описывается диаграммой обеспеченности требований тяготеющих пар, т.е. распределением долей от всех требований по уровню обеспеченности. Указанная задача представлена в виде многокритериального минимакса с диаграммным критерием.
Рисунок 7. Значения показателя уязвимости в зависимости от используемого типа сетевой структуры
Таким образом, можно сказать, что полносвязная сеть является «равнопрочной» для всех тяготеющих пар в целом, но нельзя сказать, что она менее уязвима, поскольку в сети типа «дерево» всегда находятся тяготеющие пары, для которых гарантирована более высокая степень обеспеченности их потоковых требований.
Указанный факт противоречит теорико-графовым представлениям о живучести МП-сетей, т.к. число реберной связности дерева всегда меньше, чем полного графа.
Необходимо отметить, что использование данной методики проведения расчетов допустимо для уже существующей вычислительной сети со сложившимся вектором требований при сравнении проектов модернизации сетевой системы с целью повышения ее надежности и пропускной способности.
В данной методике проведена формализация понятия решения и для ряда модельных сетей. Это дало возможность сравнить по критерию уязвимости три типа сетевых структур: линейную, кольцо и звезду, и получить нетривиальные результаты даже на простейших примерах.
– Задачи и методы исследования допустимости в условиях случайной пропускной способности [46]. Рассмотрена задача анализа эффективности многопользовательских сетевых систем со случайной пропускной способностью ребер физического графа сети. Предложен ряд вероятностных и стохастических формулировок существующей задачи о допустимости многопродуктовых потоковых сетей. Исследованы постановки, учитывающие возможную не информированность (неполную или неточную информированность) о функции распределения вектора входной нагрузки – вектора требований. Обсуждаются методы решения возникающих задач стохастической оптимизации.
29
.Дрогсет Д. В поисках истинных причин сетевых проблем. М: LAN, 2001, №6, С.28—34
30
.Кульгин М. Маршрутизация и сигнализация. М: LAN, 1998, №7—8, С.19—21
31
.Крейнес А. Вычислительные сети – без проводов. М: LAN, 1996, №6, С.27—28
32
.Савельев А. Современные протоколы маршрутизации. М: LAN, 1998, №12, С.38
33
.Олифер В., Олифер Н. Искусство оптимизации трафика. М: LAN, 2001, №12, С.18—21
34
.Шварц М. Сети ЭВМ. Анализ и проектирование. —М.: Радио и связь, 1981. -336 с.
35
.Заби З. К. Многокритериальная оптимизация построения и развития распределенных сетей. Автореф. дис… канд. технич. наук. Киев.:КПИ,1990.-17с.
36
.Парсиев С. С. Анализ и оптимизация структуры цифровых сетей интегрального обслуживания. Дис… канд. технич. наук. Л.:ЛЭИС,1989.-18с.
37
.Хохлова Е. В. Оптимизация структуры информационно-вычислительной сети АСУ ГПС. Автореф. дис… канд. технич. наук. Л.:ЛИЭИ,1989.-19с.
38
.Гурьянов В. М. Комплексная оптимизация параметров сети обмена данными в распределенных информационно-вычислительных сетях. Автореф. дис… канд. технич. наук. М.: МГИЭМ,1996.-18с.
39
.Дагвадоржиин Б. Э. Оптимизация локальной вычислительной сети по обобщенному показателю эффективности (на примере высших учебных заведений МНР). Автореф. дис… канд. технич. наук. М.:МИИГА,1991.-18с.
40
.Куракин Д. В. Оптимизация маршрутизации Информационных потоков при проектировании общероссийской сети телекоммуникаций: Дис… докт. технич. наук. М.: МГТУ,1997.-511с.-299с.
41
.Сущенко С. П. Оптимизация операционных характеристик сети передачи данных с коммутацией пакетов: Дис… докт. технич. наук. Томск.:ТГУ,1997.
42
.Малашенко Ю. Е., Новикова Н. М., Смирнов М. М. Анализ многопользовательских сетевых систем с учетом неопределенности. Многокритериальная или параметрическая постановка для неизвестных требований. М: ВЦ РАН, 1998г.
43
.Малашенко Ю. Е., Новикова Н. М. Анализ многопользовательских сетевых систем с учетом неопределенности. Задача о допустимости со случайными требованиями. М: ВЦ РАН, 1998г.
44
.Воробейчикова О. А., Малашенко Ю. Е., Новикова Н. М. Анализ многопользовательских сетевых систем с учетом неопределенности. Задача о допустимости при неслучайных потерях пропускной способности. М: ВЦ РАН, 1998г.
45
.Малашенко Ю. Е., Новикова Н. М. Анализ многопользовательских сетевых систем с учетом неопределенности. Задача нормативного анализа уязвимости многопродуктовой потоковой сети. М: ВЦ РАН, 1999г.
46
.Малашенко Ю. Е., Новикова Н. М. Анализ многопользовательских сетевых систем с учетом неопределенности. Задачи и методы исследования допустимости в условиях случайной пропускной способности. М: ВЦ РАН, 1998г.