Mitos e verdades sobre a Engenharia do Caos

1 de junho de 2022

Engenharia do Caos é um conceito cada vez mais utilizado para solucionar problemas complexos

Em 2008, a Netflix tinha um desafio determinante para seu futuro: fazer a migração do já complexo e robusto data center para cloud, ou computação em nuvem. Na época, a partir desse movimento, o termo Engenharia do Caos passou a popularizar-se no meio da tecnologia. O conceito criado pela Netflix tem como objetivo simular situações para identificar vulnerabilidades e prever problemas. Os procedimentos vão muito além de estressar sistemas, são simulações (experimentos) realizados com metodologia, monitoramento, mapeamento de resultados e plano de ação. Maurício Galdieri, engenheiro de software da techfin Pismo, fala sobre alguns mitos e verdades sobre a Engenharia do Caos.

1) A Engenharia do Caos é para geeks.

“Apesar de ser mesmo uma disciplina técnica, o conceito de Engenharia do Caos visa resolver problemas de negócio. Se um banco ficar fora do ar por alguns segundos, qual o impacto no volume de transações para milhares de seus clientes? E o impacto para os seus negócios? A quebra de confiança e o impacto na imagem de marca? Se uma empresa de concreto ficar sem sistemas e não conseguir emitir notas fiscais para liberar as betoneiras, a massa vai endurecer. Pode haver perda de maquinário, impacto ambiental, financeiro e de imagem de marca. Os clientes terão suas obras paradas e seus cronogramas impactados, o que no setor de construção significa custos adicionais e redução da margem de lucro. Tudo porque um sistema ficou fora do ar. Além do mais, nem só de sistemas informativos são feitas as organizações. Experimentos de caos podem tomar formas de simulações operacionais de diversos processos. Empresas como Google costumam praticar cenários nos quais um suposto terremoto deixa toda a equipe da Califórnia sem comunicação. Ou mesmo se acontece um acidente com um funcionário numa sala-cofre, inacessível por pessoas de fora. O que aconteceria se pessoas estratégicas na sua organização ficassem incomunicáveis num momento de crise? Existem protocolos e treinamentos para isso?”

Leia mais: Low-code: por que o “Lego” da programação tornou-se vital para as empresas

2) A Engenharia do Caos é sobre testes.

“A engenharia do caos é sobre experimentos. Embora possam parecer sinônimos, testar e experimentar são dois conceitos completamente diferentes. Quando você testa algo, você sabe o que esperar. Então você faz afirmações sobre o comportamento desejado e tenta garantir isso quando o sistema atende às condições certas. Um experimento, por outro lado, é projetado para as incógnitas. Você começa a partir de uma hipótese e procura diferentes maneiras pelas quais seu sistema pode falhar.”

3) A engenharia do caos consiste somente em criar o caos.

“Mesmo que injetar falhas e quebrar seu sistema de propósito possa parecer uma prática caótica, você deve fazer isso com pelo menos alguma estrutura. Para que um experimento de Engenharia do Caos seja bem-sucedido, é necessário seguir uma metodologia. Algum nível de monitoramento também é necessário para comparar experimentos com comportamento a partir de uma referência, mesmo se você não tiver acesso a recursos de rastreamento completos. Para citar Charity Majors, CEO e fundadora da Honeycomb.io, “Sem observação, você não tem Engenharia do Caos. Você só tem caos”. Em última análise, a Engenharia do Caos é uma ferramenta eficaz para ajudá-lo a navegar pela complexidade do seu sistema.”

4) Todos na empresa vão abraçar a Engenharia do Caos.

“Vamos encarar, Chaos Engineering soa elegante. A mera menção disso como uma prática da empresa fará com que todos participem, certo? Não tão rápido, no entanto. Precisa haver uma distinção clara entre experimentar novos modos de falha e testes, sejam eles unitários, integrados ou funcionais regulares. Sem essa distinção muito poucas pessoas verão valor em executar sessões de caos. Afinal, os sistemas já são testados automaticamente, antes de entrarem no ar. Além disso, tirar uma aplicação do ar e/ou alterar os serviços executados online em produção certamente parecerá assustador para a maioria das pessoas. Portanto, não espere respostas imediatas e apaixonadas de seus colegas. Será necessário construir um processo sólido pacientemente e ganhar lentamente a confiança necessária para executar sessões de caos regularmente.”

>> Inscreva-se ou indique alguém para a seleção Under 30 de 2022