Подтвердить что ты не робот

Как рассчитать "стоимость" аварии?

Справочная информация:

Некоторое время назад я построил систему для записи и категоризации сбоев приложений для одной из наших внутренних программ. В то время я использовал комбинацию частоты и агрегированного потерянного времени (время между запуском программы и сбоем) для определения приоритетов типов сбоев. Он работал достаточно хорошо.

Теперь, Силы, которые хотят, чтобы целые числа на стоимости каждого типа аварии работали. Или, по крайней мере, цифры, которые выглядят солидно. Полагаю, я мог бы использовать суммарное потерянное время, умноженное на какую-то правдоподобную фигуру, но это кажется хитрой.

Вопрос:

Существуют ли какие-либо установленные методы расчета реальной стоимости сбоев приложений? Или, в противном случае, опубликованные исследования, размышляющие о таких расходах?


Консенсус

Точность невозможна, но оценка, основанная на времени безотказной работы, должна быть достаточной, если она будет применяться последовательно, а ее ограничения четко задокументированы. Спасибо, Мэтт, Орион, за то, что нашли время, чтобы ответить на этот вопрос.

4b9b3361

Ответ 1

Я не видел никаких исследований, но разумная эвристика была бы такой:

(Время, прошедшее с момента последнего сохранения приложения при возникновении сбоя + Время перезапуска приложения) * Средняя почасовая скорость оператора приложения.

Оценка становится более сложной, если сбои оказывают определенное влияние на внешних клиентов, например, или могут задержать другие вещи (т.е. создать шею бутылки, чтобы другой человек зависал, ожидая, потому что какое-то другое приложение потерпело крах).

Тем не менее, ваши "силы, которые могут быть", могут быть довольны очень приблизительной оценкой, если она применяется последовательно, и они могут видеть, как она меняется с течением времени.

Ответ 2

Силы, которые хотят получить твердые цифры от стоимости каждого типа сбоев, которые будут выполняться

Я хочу летать на своем воздушном шаре на Марс, но это не значит, что такое возможно.

Серьезно, я думаю, вы обязаны сказать им, что нет способа точно измерить это. Скажите им, что вы можете ранжировать аварии, или что бы вы ни делали с вашими данными, но все, что у вас есть.

Что-то вроде "Мы не можем реально определить, сколько это стоит. У нас есть эти данные о том, как долго работают вещи и т.д., но единственный способ приложить затраты - притвориться, что X минут равно X долларов, даже если в действительности это не имеет никакого основания"

Если вы просто сделаете алгоритм калькуляции оберточной сборки и НЕ отталкиваетесь вообще, вы должны сами винить себя, когда руководство поворачивается и использует этот произвольный номер, чтобы сделать что-то глупое, как пожарный персонал, или решите не исправлять любые сбои и вместо этого сосредоточиться на использовании их синергии с sharepoint portal интернет-сервером любви к любви 2013

Обновление: Чтобы уточнить, я не говорю, что вы должны полагаться только на статистику со 100% точностью и просто отказаться от всего остального.
Я считаю важным, что вы знаете, что именно вы измеряете. Вы на самом деле не измеряете стоимость, вы измеряете время безотказной работы. Таким образом, вы должны быть заранее об этом. Если вы хотите оценить стоимость штрафа, но я считаю, что вам нужно сделать это ясно.

Если бы я должен был подготовить такой отчет, я бы назвал его "отчет об аварийном завершении" и, возможно, имел вторичное поле под названием "Ориентировочная стоимость, основанная на $5/минута". Менеджеры получают смету расходов, но ясно, что фактический отчет основан на времени безотказной работы, а стоимость - это только оценка и то, как работает оценка.

Ответ 3

Здесь отсутствует недостаток. В большинстве приложений есть фактор "потери устойчивости", когда сбои неожиданно начинают "стоить" намного больше, потому что люди теряют уверенность в том, что предоставляет ваше приложение. Как только это произойдет, это может быть очень дорогостоящим, чтобы вернуть пользователей к доверительному использованию и использованию системы.

Ответ 4

Это зависит...

С точки зрения стоимости единственное, что имеет значение, - это влияние на бизнес аварии, поэтому оно скорее зависит от типа приложения.

В случае приложений может оказаться невозможным определить влияние бизнеса. Для других могут быть средние меры.

Меры, основанные на спросе, могут быть значимыми - если продажи устойчивы, тогда может оказаться полезным время простоя для торгового приложения. Если продажи колеблются непредсказуемо, то такие меры менее полезны.

Стоимость ремонта также может быть полезна.