Июнь 2019 — Заметка №7

Со временем все разрушается.

Если сделать отличный продукт, процесс, да что угодно и перестать трогать, то со временем он испортится. Начнет немного “подгнивать”. Быстрый продукт станет медленным. Хороший сервис станет посредственным. В крутой команде появляются странные (в плохом смысле) люди. Прекрасный, удобный и понятный дизайн превратится в “кухонный комбайн” из фич.

Возможно это разрушение связано с тем, что со временем “замыливается” глаз и понижается чувствительность к проблемам (мы ко всему привыкаем). Или системы дрейфуют в сторону того, что проще делать — а делать “так себе”" всегда проще. Какие бы причины не были, этот паттерн вы можете увидеть во многих местах вокруг нас.

Чтобы это предотвратить, надо прилагать постоянные явные усилия. Эти усилия будут подчас встречать возражения и отпор, но без них нельзя. Нужно держать в голове нужную планку, сравнивать результат с ней и корректировать происходящее, если нужно.

Вот неочевидный пример.

Пару недель назад была история с Digital Ocean (это такой хостинг известный), когда они заблокировали аккаунт какой-то компании вместе со всеми бэкапами. Поднялся шум в Твиттере и в конце концов аккаунт разблокировали. CTO Digital Ocean написал подробный пост-мортем, который интересен сам по себе. Но меня же там привлекла вот эта часть:

Upon recognizing his resources had been powered off, and the account locked, the customer replied to the ticket created for communication on the action. An Abuse Operations agent re-enabled the account 12 hours after the initial ticket. However, a mistake occurred and the agent did not flag the account as approved for the CPU-intensive activity that was the cause of the initial flag.

On May 30, the same automated service then acted on the account a second time, due to the absence of a safety flag. Upon a second review by a different Abuse Operations agent (nearly 29 hours after the customer responded to the second flag), the agent failed to recognize this was a false positive, and the agent fully denied access back into the account. This action triggered the final “access denied” communication to the customer. At this point, the customer initiated the series of tweets to gain the attention of DigitalOcean.

В первый раз аккаунт заблочили. Владелец аккаунт дал объяснения, которые были обработаны только спустя 12 часов. Когда аккаунт заблочили второй раз, то задержка составила 29 часов и саппортер не разобрался опять и закрыл доступ насовсем.

Вдумайтесь, среднее время рассмотрения аппеляции, когда закрыли твой аккаунт (и ты в панике) — 12 часов или больше! Но так как скорее всего подавляющее число обращений к Abuse Operations у Digital Ocean это были настоящие плохие ребята (спамеры, хакеры — кого нужно закрывать и кого не жалко), а false positives мало относительно общего числа клиентов, то планка снизилась. Всем было “норм”, А ЧТО ТАКОГО. В таких ситуациях нужен человек, который сможет сказать “ребята, ну это же фигня какая-то — разве это правильно? Давайте это исправим”. Каждый может и должен быть таким человеком.