Пример работы системы проверки связи |
Например, если настройки выполнены так, как указано на рисунке ниже (обратите внимание, данные настройки не являются рекомендуемыми!), то комплекс ФПСУ-IP с двумя рабочими портами, работающий в режиме «горячего» резервирования, будет проводить отдельную проверку для каждого рабочего порта следующим образом: Активный комплекс ФПСУ-IP системы горячего резерва (далее ФПСУ№1) каждые 30 секунд будет направлять эхо-запросы в адрес хостов первого порта 077.108.111.097, 172.010.002.240, 172.016.002.001, и эхо-запросы в адрес хостов второго порта 172.018.100.003, 198.111.223.133, 192.168.111.211. Проверки доступности хостов каждого порта проводятся независимо друг от друга. Если все хосты, указанные на первом порту в качестве отслеживаемых, не отвечают на эхо-запросы (порт «замолчал»), ФПСУ№1 начинает выполнять 8 повторных рассылок эхо-запросов на хосты первого порта, каждая с интервалом в 5 секунд. То же самое происходит, если перестали отвечать на запросы отслеживаемые хосты второго порта: ФПСУ№1 начинает выполнять 8 повторных рассылок эхо-запросов на хосты второго порта, каждая с интервалом в 5 секунд. Если в результате 8 повторных рассылок не был получен эхо-ответ от хотя бы одного хоста «замолчавшего» порта, ФПСУ№1 отдает управление другому комплексу горячего резерва (далее ФПСУ№2), становясь пассивным и устанавливая 5-минутный (1 минута параметра время перепроверки линий связи умножается на 5, поскольку это первая передача управления по причине неуспешной проверки линии связи) таймер, запрещающий принимать активное управление обратно. В течении работы таймера состояние ФПСУ№1 в системе горячего резервирования устанавливается как «Работоспособность: частичная» с дополнительной строкой сообщения «нет канала связи», что можно отследить на экране отображения состояния горячего резерва.
Через 15 секунд (постоянный параметр) после становления активным, ФПСУ№2 начинает проверку доступности хостов первого порта 077.108.111.097, 172.010.002.240, 172.016.002.001 и проверку доступности хостов второго порта 172.018.100.003, 198.111.223.133, 192.168.111.211. Если ответ с проверяемых хостов «замолчавшего» порта не был получен в результате первой проверки или в результате 8 повторных проверок с интервалом в 5 секунд, то ФПСУ№2 устанавливает себе состояние «Работоспособность: частичная», «нет канала связи» и запрашивает ФПСУ№1 о возможности передать управление комплексом. Если на ФПСУ№1 все ещё действует таймер запрета передачи управления, то ФПСУ№2. остается активным комплексом и ждет ещё 1 минуту (параметр время перепроверки линий связи) перед запуском следующей серии проверок доступности хостов. После каждой неуспешной серии проверок ФПСУ№2 запрашивает ФПСУ№1 о возможности передать управление комплексом. Если во время такого запроса таймер запрета передачи управления на ФПСУ№1 уже закончился, то ФПСУ№2 передает управление на ФПСУ№1 и устанавливает собственный таймер запрета передачи управления, равный 5 минутам (1 минута параметра время перепроверки линий связи умножается на 5, поскольку это первая передача управления по причине неуспешной проверки линии связи). ФПСУ№1 становится активным и через 15 секунд (постоянный параметр) запускает первую серию проверок доступности хостов, и так же будет пытаться передать управление ФПСУ№2 в случае неуспешного результата проверки. Единственным отличием будет длительность таймера запрета передачи управления, который будет установлен в 1 минуту (1 минута параметра время перепроверки линий связи без умножения на первичный коэффициент 5). Такая схема передачи управления и поочередной проверки доступности хостов будет повторяться до тех пор, пока ФПСУ№1 или ФПСУ№2 не получит хотя бы один эхо-ответ с хостов «замолчавшего» порта. |