Ошибка инженеров Krek Ltd привела к недоступности многих российских и мировых сетевых ресурсов

Многие россияне на себе почувствовали цену небольшой ошибки при конфигурировании глобальных сетей основными провайдерами страны. Компания Qrator Labs говорит о глобальном сбое и отсутствии доступа ко многим сетевым сервисам в России из-за ошибочных действий инженеров небольшого провайдера Krek Ltd, который обслуживает порядка 40 тыс. абонентов при работе с протоколом перенаправления трафика Border Gateway Protocol.

Протокол BGP отвечает за правила прохождения трафика через сети различных операторов, подключенных к системе, неверная его настройка может привести к печальным последствиям и перенаправлению потоков данных в сети с недостаточной пропускной способностью. При несоблюдении объема трафика и пропускной способности линий связи может возникнуть перегрузка и отключение целых сегментов сети по всей стране. Именно такая ситуация и произошла 25 ноября 2018 года, затронувшая до 20% всех абонентов.

Часовой отрезок с 16 до 17 часов стал настоящим бедствием, в это время компания Krek Ltd пыталась переконфигурировать свои сети и в результате ошибки перенаправила подавляющую часть трафика крупнейшего российского провайдера «Ростелеком» через свою региональную сеть. Естественно, через несколько минут она оказалось полностью заполнена, заставив миллионы абонентов увидеть на своих экранах сообщение «Сервер временно недоступен». Недоступными оказались не только российские, но и зарубежные сервисы, например, Youtube, Вконтакте, крупнейшие онлайн-кинотеатры, интернет магазин Amazon не открывались порядка часа. Всего пострадало порядка 5000 региональных и общероссийских сетей, трафик которых не смог пробиться через недостаточно широкие каналы Krek Ltd.

Фактически, данная ситуация стала результатом наложения друг на друга двух ошибок. Первая: инженеры Krek неверно сконфигурировали протокол «Border Gateway Protocol», перенаправив на себя огромный трафик «Ростелекома» и других сетей. Вторым виновником проблемы можно назвать специалистов самого «Ростелекома», которые не предусмотрели возможность такой ситуации и не настроили правила фильтрации на стыковом оборудовании.

В результате возникшей ситуации подвисли не только сети указанных провайдеров, но и множества сопряженных с ними. Специалисты вовремя получили оповещение об инциденте и обычное прохождение трафика было восстановлено через час с небольшим.

Спасибо за внимательность!
Выделите опечатку и нажмите Ctrl + Enter, чтобы отправить сообщение об ошибке.