Kaos maymunu nedir?

Başarısızlık, büyük bir ağ çalıştırırken isteyeceğiniz son şeydir, özellikle de milyarlarca dolarlık bir işi destekleyen bir ağa sahipseniz. Ancak başarısızlığı önlemek, pratik ve iyi bir planlama gerektirir. Bu nedenle Netflix, kendi ağına haftada 1.000’den fazla saldıran kaos maymunu adını verdiği bir yazılıma sahiptir. Kaos maymunu, Netflix’te kaos mühendisliğinin de başlangıcıdır. Peki kaos mühendisliği nedir? Bir örnekle; büyük, kontrolsüz bir orman yangınını önlemeye yardımcı olmak ya da kontrollü bir orman alanın yanmasını sağlamaktır.

Netflix’in amacı, başarısızlığa neden olma sürecini otomatikleştirmek ve Netflix mühendislerini müşterilerin fark etmeyeceği küçük arızalardan kurtulmaya zorlayarak, video yayın hizmetindeki büyük kesintileri önlemektir. Arıza türlerini bulup çoğu zaman kimse tarafından fark edilmeden sonlandırmaktır.

Bu örneği “şirketlerde kırılganlık nasıl tasarlanmalı?” sorusuna ilham olması için paylaştım. Çünkü Netflix, kaos maymunu ile stres etkenlerini azalttı. Sistemlerini sürekli, rastgele bir şekilde hackleyecek, kaos yaratacak bir şeye odaklanmak yerine sorunların üstesinden gelecek, uyum sağlayacak bir sistem oluşturarak gizli riske, tipik riske meydan okudu.

İşimiz ne kadar büyükse, belirsizlikten o kadar çok yanlışı yönetir veya kaybetmeye devam ederiz. O halde kötü şeyler hakkında endişelenmeliyiz ancak öngörülemezlik anlayışımızı daha iyi olmak için yakıt olarak kullanmalıyız. Başarısızlık etrafındaki damgayı kaldırmalı, büyüyeceksek yeni yöntemlere izin vermeliyiz.