G
enby!

RndTech Reliability Meetup — "Математика надежности" (Вадим Мартынов, Лид команды надёжности,Яндекс)

Наш митап про надёжность и отказоустойчивость — как делать сервисы устойчивыми, быстро восстанавливаться, почему инциденты это нормально (и даже хорошо) и чем же всё таки отличается Reliability от Resiliency. Есть много способов повысить надёжность — мы делаем ретраи, срезаем избыточную нагрузку, отключаем необязательные функции, реплицируем сервисы или делаем фолбеки на критичную логику. При системной работе с надёжностью мы учитываем статистику инцидентов и охотимся за низко висящими фруктами. Но из чего складывается надёжность и как её посчитать? Посмотрим, как влияют наши решения на надёжность системы и как учитывать это при разработке.

Смотрите также