Как определить RTO?
Аварийное восстановление — это процесс восстановления и запуска сервисных инструментов для предоставления услуг. В мире ИТ этот план аварийного восстановления заключается в том, как восстановить ваши приложения, запустить их и запустить на 100 % после того, как авария помешала их функционированию. И о нем стоит позаботиться каждому, ведь в противном случае потери могут быть в разу больше.
Для обеспечения непрерывности функционирования бизнеса необходимо проанализировать много этапов и столкнуться с большим количеством различных показателей. Сейчас нас интересует время восстановления после отказа.
Стандартное определение RTO — это продолжительность времени, в течение которого в случае аварии компания может начать полноценно функционировать (или хотя бы выполнять критически важные операции).
Давайте разберем это немного дальше. Допустим, ваш бизнес говорит, что веб-сайт (или различные другие процессы) может быть недоступен в течение 30 минут, прежде чем вы начнете терять серьезные деньги, а также наносить ущерб бренду. (Это просто пример некоторые веб-сайты не могут позволить себе быть недоступными и в течение 30 минут). Это означает, что ваш RTO составляет 30 минут. Если произойдет бедствие, вы хотите убедиться, что вы готовы к работе через 30 минут. В первую очередь важно думать об этих временах с точки зрения бизнеса. Бизнес-подразделение должно принимать во внимание фактические затраты (потеря бизнеса), ущерб для бренда (будет ли сбой в новостях?) и эксплуатационные расходы (что потребуется для запуска и работы?). Как только истинная стоимость определена, бизнес может взять эту информацию и сообщить технической команде, какой лимит времени для каждой бизнес-системы. Большинство деловых людей обычно говорят: «Время простоя недопустимо» или «секунды» или «минуты».
Отсюда мы должны думать с точки зрения того, что бизнес просит технических специалистов. Если они говорят, что RTO — это секунды… что это значит на самом деле? Как правило, это дорогостоящее оборудование, полностью резервированные системы, готовые к работе в любое время. Для бизнес-систем, которые могут выдерживать 30 минут или час, это может означать нечто иное. А для бизнес-систем, которые могут работать более 4 часов, это снова нечто другое. Важно знать допустимое значение RTO для каждой системы, поскольку не все бизнес-системы одинаковы. Например, для веб-сайта электронной коммерции вы можете захотеть, чтобы показатель RTO был равен секундам, тогда как для внутреннего веб-сайта отдела кадров вы могли бы допустить несколько дней.
Требуется тщательное изучение каждой системы и ее уникальных потребностей. Запустить систему и запустить ее после того, как она вышла из строя, — непростая задача. Необходимы забота и планирование, чтобы организация могла быть восстановлена быстро и эффективно. Помочь с определением rto disaster recovery и разработать план могут сотрудники компании IT-Solutions.