[#] Аудит одного «медленного» приложения в одном крупном концерне
habrabot(difrex,1) — All
2015-04-30 12:30:03


В общем-то хотел просто ответить на [этот][1] комментарий и в качестве примера привести неожиданные результаты одного как-то сделанного мною аудита веб-приложения, но ответ получался очень громоздкий. Так родилась эта статья.

#### Вступление

Речь шла о том, что иногда в корпоративном секторе, прикрываясь надуманными нормативами или навязанными стандартами от безопасности, случаются совершенно неоправданные, а иногда и совершенно дикие реализации последних, нередко граничащих просто с невозможными условиями работы. Например CIO и иже с ним (либо нерадивые или просто ленивые исполнители), руководствуясь такими политиками, возможно переусердствовали, а часто не нашли (или не искали) лучшего решения. В результате имеем антивирусы на серверах, со всеми вытекающими, _потому что просто должен быть на каждом компьютере_. Сотрудников вынужденных работать под админом (aka MakeMeAdmin), _потому что создать админский аккаунт (тех-юзера), тупо для скриптов, перестартовки и дебага сервисов, ну никак не возможно (да и ладно — все-равно есть же антивирус)_. Политики позволяющие запустить исполняемый файл отовсюду (сеть, временный каталог и т.д.), _потому что какая-то там служба обновления по другому не умеет (не страшно — снова антивирус как аргумент)._ И т.д. и т. п. На самом деле я совершенно четко понимаю откуда у таких требований ноги растут. Довольно часто это действительно условия клиентов-заказчиков, требования материнской там или партнерской компании или де-факто стандарты индустрии, которым просто нужно соответствовать. Ну т.е. тупо никуда не денешься. Но, дело в том что технически как раз некоторые вещи, что касается безопасности, совершенно не оправданы, хуже того в действительности совсем «не секьюрны», мало того — мешают как разработке, так и продуктивной работе того же клиента. И если прикрывая свою пятую точку (прикрываясь фальшивыми «стандартами»), решаешь соответствовать требованию безопасности от лукавого, то сделай это хотя бы включая голову, так чтобы это не влияло (ну или минимально влияло) на продуктивность компании. Пример: как-то бились с одним известным антивирусом (доказуемо бажным, вероятно где-то в районе аналитики и очередях real time scanning) — при очень большой загруженности сервера (32 ядра >= 50% cpu load):

* антивирус блокирует (от нескольких миллисекунд до 30 секунд!) доступ к файлам, после их переименования — в результате многопоточный pipeline (асинхронная очередь заданий) периодически вылетает с «access denied» при доступе например к временным, только что созданным и затем переименованным файлам из другого потока, сообщившего об окончании работы. При том, что working folder вроде бы из real time scanning.
* или того хуже, кладет дочерние процессы спать (suspended) и забывает их «разбудить», а поток в предке бесконечно ждет окончания работы уснувшего дитя.

И ведь отключить его в продакшн на серверах _«никак не возможно»_ (даже временно в качестве доказательства, т.к. таким антивирусом как правило они себе одно место прикрывают). Например, что стоит разделить ту же сеть и воткнуть тот же антивирус за NAT-ом. Или хотя бы проверить на такие болячки и заменить на другой, более надежный. Сравните эту стоимость со скажем человеко-часом \* 25000 сотрудников, ежедневно минута за минутой тратящихся на тупое ожидание ответа приложения. А в результате растет-растет число велосипедов типа «safe\_rename», «real\_delete» или «start\_process\_with\_observe» вокруг проектов. Тот же CIO быстро пересмотрел бы свою позицию, если бы ему (его подразделению) коллективный счет выставить за суммарное время «простоя» (ожидания) всех сотрудников. [Итак аудит ...][2]

[1]: /post/256793/#comment_8397441
[2]: http://habrahabr.ru/post/256975/#habracut