Как разработать самовосстанавливающуюся распределенную службу?
Для баз данных обычным способом решения проблемы толерантности к разделам является использование кворума для записи. Это значит, что каждый раз, когда что-то записывается, минимальное количество узлов должно подтвердить запись.
Минимальное количество узлов, необходимое для корректного восстановления после отказа одного узла, составляет три узла. Таким образом, два исправных узла смогут подтвердить состояние системы.
Для облачных приложений эти три узла обычно распределяются по трем зонам доступности.
Библиотека задач по DevOps
>>Click here to continue<<