11 минут · задать измеримые цели надёжности через error budget
SLO, SLI и error budget для платформенных команд: минимальный контракт на надёжность
Дашборды и количество алертов не определяют надёжность. В статье — как небольшой platform-команде выбрать один–два пользовательских SLI, задать SLO на 30 дней с error budget, настроить burn-rate алерты и связать политику бюджета с решениями о релизах.
