Gallery
Эссе по курсу “Системная инженерия"
Share
Explore

icon picker
System safety and failures


Table 7
Потенциальные отказы
Причины отказа
Вероятность
Последствия отказа:
Возможность контроля появления
Notes
1
Сбой системы обработки платежей
Ошибки в коде программного обеспечения
Проблемы с партнерами-провайдерами платежей
низкая
Потеря продаж и клиентов
Ущерб для репутации
Внедрение механизмов мониторинга: Реализация системы мониторинга, которая следит за работоспособностью системы обработки платежей и предупреждает об их сбоях, чтобы проблемы могли быть обнаружены и устранены в самом раннем этапе.
Регулярные аудиты безопасности: Проведение периодических аудитов безопасности, чтобы обнаружить и устранить уязвимости, связанные с системой обработки платежей, и обеспечить ее надежность и защиту от атак.
Open
2
Отказ сервера
Перегрузка трафика
DDoS атака
Проблемы с сетевыми соединениями
средняя
Недоступность магазина
Задержки и потеря данных
Использование высокодоступной инфраструктуры: Развертывание инфраструктуры, которая обеспечивает высокую доступность серверов, включая резервные копии, горизонтальное масштабирование и балансировку нагрузки, чтобы снизить риск отказа сервера и обеспечить непрерывную работу магазина.
Автоматическое мониторинг и восстановление: Внедрение системы мониторинга серверов, которая автоматически обнаруживает сбои и выполняет процедуры восстановления, например, автоматическое перезапускание сервера или перенаправление трафика на резервные серверы.
Open
3
Проблемы с доставкой уведомлений и сообщений
недостаточное обеспечение мощностей для обработки большого числа запросов
проблемы с почтовыми серверами
средняя
Потеря связи с клиентами
Недоверие и неудовлетворенность клиентов
Многоуровневая доставка сообщений: Реализация многоуровневой системы доставки уведомлений, которая использует различные каналы связи, такие как SMS, электронная почта, пуш-уведомления и т.д., для обеспечения доставки сообщений в случае сбоя на одном из каналов.
Мониторинг доставки сообщений: Внедрение системы мониторинга, которая отслеживает статус доставки уведомлений и предупреждает об их неудачной доставке, чтобы проблемы могли быть быстро идентифицированы и решены
Open
4
Сбой в системе обработки заказов
ошибки программирования, некорректную обработку данных
недостаток ресурсов для обработки большого числа заказов
средняя
Задержки в обработке и доставке заказов
Потеря заказов и доходов
Внедрение механизмов контроля целостности данных: Использование механизмов проверки и подтверждения данных при обработке заказов, чтобы минимизировать возможность ошибок и исключить возможность неправильной обработки заказов.
Регулярное тестирование и отладка: Проведение регулярного тестирования системы обработки заказов, включая отладку кода и проверку целостности данных, чтобы обнаружить и исправить потенциальные проблемы до их воздействия на работу системы.
Open
5
Проблемы с системой управления товарным запасом
Ошибки в обновлениях данных
Проблемы с синхронизацией данных между системами
средняя
Несоответствие запасов и спроса
Проблемы с учетом и планированием
Автоматизация учета товарного запаса: Внедрение системы автоматического учета запасов, которая позволяет точно отслеживать наличие товаров на складе, и своевременно обновлять данные, чтобы избежать ошибок в учете и предотвратить ситуации с несоответствием запасов и спроса.
Интеграция с поставщиками данных: Установление надежной интеграции с поставщиками данных, чтобы получать актуальную информацию о наличии товаров, предупреждать о возможных проблемах и своевременно обновлять данные о запасах.
Open
There are no rows in this table
Потенциальные отказы: Неправильная настройка магазина, отсутствие важных функций, сбои в обработке платежей, сбои в системе обратной связи
Причины отказа: Ошибки в коде, отсутствие адекватного тестирования, непредвиденные проблемы с интеграцией
Последствия отказа: Упущенные возможности для продаж, неудовлетворенные клиенты, потеря доходов, негативное влияние на репутацию

MTTF (средняя наработка до отказа) - 1 год
MTTR (среднее время восстановления, исправления, реагирования или устранения) - от 1 до 4 часов в зависимости от сложности и серьезности проблемы
MTBF (средняя наработка на отказ) - 1 год (Для системы онлайн-магазина, которая предназначена для продолжительного использования, MTTF может быть не таким релевантным показателем.)
Значения выбраны на основе стандартных практик индустрии.
Описать допустимый и остаточный риск в 2 ситуациях во время эксплуатации системы
Ситуация
Допустимый риск
Остаточный риск
1
Отказ системы обработки платежей
Может быть допустимым короткий период времени, когда система обработки платежей не работает из-за обслуживания или обновления. Это может быть запланировано заранее, и клиенты могут быть уведомлены об этом, чтобы они могли планировать свою работу соответствующим образом.
Даже после применения контролирующих мер, как обслуживание и тестирование системы перед обновлением, существует риск, что система может отказать после обновления из-за непредвиденных проблем. Это может привести к простою магазина и потере продаж.
2
Проблемы с производительностью сайта
Из-за возможного разнообразия трафика и пиковых нагрузок, возможны некоторые задержки в загрузке страниц и выполнении операций. Организация может определить уровни производительности, которые она считает приемлемыми, с учетом того, что периодические незначительные задержки в работе сайта являются неизбежными.
Даже с оптимизацией производительности и масштабированием ресурсов для справления с пиковыми нагрузками, остается вероятность того, что сайт может столкнуться с существенными проблемами производительности. Это может быть вызвано непредсказуемо высоким трафиком, атаками DDoS или другими проблемами. Такие ситуации могут привести к значительным задержкам или даже недоступности сайта, что негативно отразится на пользовательском опыте и продажах.
3
There are no rows in this table

Описать не менее 2 опасных событий (hazardous event)

Кибератака на систему онлайн-магазина: Кибератака на систему онлайн-магазина представляет серьезную угрозу для безопасности данных, операций и репутации бренда. Злоумышленники могут использовать различные методы, такие как взлом аккаунтов, фишинг, внедрение вредоносного кода или отказ в обслуживании (DoS) атаки, чтобы получить несанкционированный доступ к клиентской информации, кредитным картам или даже нарушить работоспособность магазина. Это может привести к утечкам данных, финансовым потерям, негативному влиянию на доверие клиентов и повреждению репутации компании.
Технический сбой сети у поставщика облачных услуг: Поскольку платформа для онлайн-магазина основана на инфраструктуре облачных услуг, технический сбой или сбой сети у поставщика облачных услуг может иметь серьезные последствия. Это может привести к недоступности магазина, потере данных, задержкам в обработке заказов и прекращению работы бизнеса.

Описать не менее 2 разумно предсказуемых неправильных использований (reasonably foreseeable misuse)

Злоупотребление скидочными кодами или акциями: Это может включать многократное использование одного скидочного кода, передачу скидочного кода третьим лицам или использование его после истечения срока действия. Такое неправильное использование может привести к финансовым потерям для магазина и нарушению честной конкуренции. Для предотвращения этого могут быть приняты меры, такие как ограничение количества использований скидочного кода, связывание скидки с аккаунтом пользователя или четкое указание условий использования акций. Можно ввести ограничения на то, насколько сильно цены могут меняться в течение определенного периода времени. Если попытка изменения цены выходит за эти пределы, система может автоматически блокировать такое изменение или отправлять предупреждение для дополнительной проверки.
Неправильное использование инструмента управления ценами: пользователь неправильно настроит автоматическое обновление цен или скидок, это может привести к значительным финансовым потерям. Например, если пользователь случайно устанавливает цену товара слишком низкой, он может потерять значительную прибыль от продажи.

Описать не менее 1 связанного, каскадного отказа


Отказ системы обработки платежей: В результате технического сбоя или кибератаки система обработки платежей становится недоступной и неспособной принимать платежи от клиентов.
Отказ системы управления заказами: Поскольку система обработки платежей является неотъемлемой частью системы управления заказами, ее отказ приводит к невозможности обработки новых заказов или обновления статуса существующих заказов. Это может привести к задержкам в обработке заказов и недовольству клиентов.
Отказ системы уведомлений: В связи с отказом системы управления заказами, система уведомлений не может отправлять уведомления клиентам о статусе и обновлениях заказов. Клиенты не получают информацию о подтверждении заказа, отправке товара или изменении статуса доставки, что вызывает недоверие и неудовлетворенность.
Отказ системы управления товарным запасом: Без своевременного обновления заказов и информации о запасах, система управления товарным запасом может не отображать актуальные данные о наличии товаров. Клиенты могут делать заказы на товары, которых уже нет в наличии, что приводит к разочарованию и неудовлетворенности.
Таким образом, отказ в одной системе (системе обработки платежей) может вызвать каскадный эффект, затрагивая другие системы (систему управления заказами, систему уведомлений и систему управления товарным запасом). Это может привести к серьезным проблемам в функционировании онлайн-магазина и ухудшению опыта покупателей. Чтобы предотвратить вероятность связанного, каскадного отказа, следует разделить ключевые компоненты системы, такие как система обработки платежей, система управления заказами, система уведомлений и система управления товарным запасом, и обеспечьте их изоляцию.

Share
 
Want to print your doc?
This is not the way.
Try clicking the ⋯ next to your doc name or using a keyboard shortcut (
CtrlP
) instead.