Пример работы системы проверки связи |
Например, если настройки выполнены так, как указано на рисунке ниже (обратите внимание, данные настройки не являются рекомендуемыми!), то комплекс ФПСУ-IP, работающий в режиме горячего резервирования, будет проводить отдельную проверку для каждого порта следующим образом: Активный комплекс ФПСУ-IP системы горячего резерва (далее ФПСУ№1) каждые 30 секунд будет направлять эхо-запросы в адрес хостов первого порта 077.108.111.097, 172.016.002.001, 172.010.002.240, и эхо-запросы в адрес хостов второго порта 192.168.111.211, 198.111.223.133. Проверки доступности хостов каждого порта проводятся независимо друг от друга. Если все хосты, указанные на первом порту в качестве отслеживаемых, не отвечают на эхо-запросы (порт "замолчал"), ФПСУ№1 начинает выполнять 8 повторных рассылок эхо-запросов на хосты первого порта, каждая с интервалом в 5 секунд. То же самое происходит, если перестали отвечать на запросы отслеживаемые хосты второго порта: ФПСУ№1 начинает выполнять 8 повторных рассылок эхо-запросов на хосты второго порта, каждая с интервалом в 5 секунд. Если в результате 8 повторных рассылок не был получен эхо-ответ от хотя бы одного хоста "замолчавшего" порта, ФПСУ№1 отдает управление другому комплексу горячего резерва (далее ФПСУ№2), становясь пассивным и устанавливая 5-минутный (1 минута параметра время перепроверки линий связи умножается на 5, поскольку это первая передача управления по причине неуспешной проверки линии связи) таймер, запрещающий принимать активное управление обратно. В течении работы таймера состояние ФПСУ№1 в системе горячего резервирования устанавливается как "Работоспособность: частичная" с дополнительной строкой сообщения "нет канала связи", что можно отследить на экране отображения состояния горячего резерва.
Через 15 секунд (постоянный параметр) после становления активным, ФПСУ№2 начинает проверку доступности хостов первого порта 077.108.111.097, 172.016.002.001, 172.010.002.240 и проверку доступности хостов второго порта 192.168.111.211, 198.111.223.133. Если ответ с проверяемых хостов "замолчавшего" порта не был получен в результате первой проверки или в результате 8 повторных проверок с интервалом в 5 секунд, то ФПСУ№2 устанавливает себе состояние "Работоспособность: частичная", "нет канала связи" и запрашивает ФПСУ№1 о возможности передать управление комплексом. Если на ФПСУ№1 все ещё действует таймер запрета передачи управления, то ФПСУ№2. остается активным комплексом и ждет через 1 минуту (параметр время перепроверки линий связи) перед запуском следующей серии проверок доступности хостов. После каждой неуспешной серии проверок ФПСУ№2 запрашивает ФПСУ№1 о возможности передать управление комплексом. Если во время такого запроса таймер запрета передачи управления на ФПСУ№1 уже закончился, то ФПСУ№2 передает управление на ФПСУ№1 и устанавливает собственный таймер запрета передачи управления, равный 5 минутам (1 минута параметра время перепроверки линий связи умножается на 5, поскольку это первая передача управления по причине неуспешной проверки линии связи). ФПСУ№1 становится активным и через 15 секунд (постоянный параметр) запускает первую серию проверок доступности хостов, и так же будет пытаться передать управление ФПСУ№2 в случае неуспешного результата проверки. Единственным отличием будет длительность таймер запрета передачи управления, который будет установлен в 1 минуту (1 минута параметра время перепроверки линий связи без умножения на первичный коэффициент 5). Такая схема передачи управления и поочередной проверки доступности хостов будет повторяться до тех пор, пока ФПСУ№1 или ФПСУ№2 не получит хотя бы один эхо-ответ с хостов "замолчавшего" порта. |