Falha na Cloudflare preocupa especialistas sobre concentração de dados online

Na última terça-feira (18), uma queda no serviço de internet afetou praticamente todo o mundo. Isso porque o provedor de infraestrutura web Cloudflare, considerado a maior nuvem de conectividade, sofreu uma interrupção e fez com que os principais sites estivessem fora do ar – do Spotify ao ChatGPT.

A empresa emitiu um comunicado em seu blog e alegou que o incidente não teve nenhuma ligação com ataque cibernético, e sim com um problema técnico que a afetou a rede em todo mundo, já que 20% dos sites utilizam o serviço da Cloudflare. O ocorrido, no entanto, preocupa especialistas que alertam para o perigo da alta concentração de informações em um único provedor.

Incidente e comunicado

Na manhã da última terça-feira (18), por volta de 8:50 (horário de Brasília), diversos portais estiveram indisponíveis ou apresentaram mensagens de erro. Inclusive, o próprio DownDetector (site que detecta falha de serviços de internet) esteve fora do ar por alguns momentos.

Após o incidente, o CTO (sigla em inglês para Chief Technology Officer, ou Chefe de Tecnologia) da Cloudflare, Dane Knecht, emitiu um comunicado em seu perfil no X pedindo desculpas aos usuários da nuvem: “Falhamos com nossos clientes e com a internet em geral”.

O CEO da Cloudflare, Matthew Prince, também se manifestou em seu perfil no X: “Deixamos a Internet na mão hoje. Aqui está nossa análise técnica post mortem do que aconteceu. Em nome de toda a equipe da @Cloudflare, peço desculpas”.

Prince fez uma publicação extensa e detalhada no blog da empresa para explicar o ocorrido. Ele disse que a falha não foi ocasionada por ataque cibernético, mas “por uma alteração nas permissões de um de nossos sistemas de banco de dados, o que fez com que gerasse múltiplas entradas em um ‘arquivo de recursos’ usado pelo nosso sistema de gerenciamento de bots. Esse arquivo de recursos, por sua vez, dobrou de tamanho. O arquivo de recursos, maior do que o esperado, foi então propagado para todas as máquinas que compõem nossa rede”. Foi isso que o que ocasionou a queda na rede.


Matthew Prince, CEO da Cloudflare (Foto: reprodução/Steve Jennings/TechCrunch/Getty Images Embed)


Perigo na concentração digital

Esta não é a primeira vez em que a internet sofre com este tipo de “apagão”. Recentemente, um problema na Amazon Web Services interrompeu a rotina diária de milhões de pessoas, em alguns casos impedindo-as de realizar até mesmo tarefas simples como pedir café ou controlar eletrodomésticos inteligentes. Apenas alguns dias depois deste fato, o serviço Azure da Microsoft também sofreu uma interrupção.

A Cloudflare afirma processar, em média, 81 milhões de requisições HTTP por segundo — ou seja, quando os navegadores precisam de determinados dados para executar uma ação, como carregar uma página da web. Em virtude dos fatos ocorridos em um curto espaço de tempo, especialistas alertam para a alta concentração digital em uma única nuvem.

Segundo Eileen Haggerty, vice-presidente de marketing de produtos e soluções da Netscout, empresa de TI e cibersegurança, interrupções tecnológicas como essas são “problemas muito, muito comuns”. Contudo, reconheceu que a sensação é de que essas interrupções estão acontecendo com mais frequência, principalmente devido à escala do seu impacto.

Para Rodrigo Gava, diretor criativo do 360 BC Group, a internet foi projetada para evitar pontos únicos de falha. O conceito de redes com comutação de pacotes e rotas alternativas surge precisamente dessa necessidade de resiliência.

Porém, é feito exatamente o oposto: concentração, aplicações, segurança, DNS, distribuição de conteúdo, autenticação e observabilidade em poucos provedores globais. E quando um deles falha, o “efeito dominó” se alastra sobre as mais diversas operações. Segundo ele, o problema está na dependência estrutural sem um plano de contingência.