
O serviço de computação em nuvem da Amazon, o AWS (Amazon Web Services), apresentou falhas nesta segunda-feira (20) e derrubou sites e aplicativos ao redor do mundo, na maior interrupção do tipo desde o apagão global do ano passado.
Os problemas começaram durante a madrugada, passaram por correções durante a manhã e ainda persistiam no fim desta tarde. Ao longo do dia, o site de monitoramento da plataforma anunciou correções pontuais, e às 17h52 dizia que a recuperação continuava a melhorar, ainda sem previsão de retorno integral.
Serviços como o AWS permitem que empresas e usuários armazenem dados, rodem aplicativos e acessem recursos de computação pela internet, sem a necessidade de manter servidores físicos próprios. Hoje, são três as principais plataformas: a da Amazon, líder do setor, a Azure (Microsoft) e Google Cloud.
Grandes empresas do mundo todo dependem de serviços de nuvem para operações internas e na relação com clientes.
A plataforma de monitoramento Downdetector registrou um pico cerca de mil reclamações de usuários do AWS às 14h no Brasil. Nos EUA, o número chegou a 10 mil no mesmo horário e continuava acima de 5.000 por volta das 17h30. Os padrões se repetiram em países da América Latina, Europa e Ásia.
No Brasil, as instabilidades atingiram aplicativos como iFood, Duolingo, Mercado Livre, Roblox e plataformas financeiras como PicPay.
Serviços da própria Amazon como Prime Video e a assistente virtual Alexa também apresentaram falhas, bem como o app de IA Perplexity. Nos EUA, a falha afetou serviços como Lyft, Venmo e Snapchat.
No fim da tarde, 94 serviços do AWS ainda tinham problemas e 46 constavam como resolvidos no site da empresa. A Ookla, proprietária do Downdetector, disse que mais de 4 milhões de usuários relataram problemas devido ao incidente.
O AWS relatou o problema operacional no estado de Virgínia, nos Estados Unidos, um dos seus principais data centers globais. O local sofreu interrupções em 2020 e 2021. Segundo a companhia, cerca de 500 empresas hospedadas na nuvem da Amazon sofreram um apagão, em vários países.
De acordo com a documentação no site do AWS, a região US-EAST-1 é frequentemente a padrão para muitos serviços do AWS.
Usuários da Alexa eram informados do problema ao tentar acessar o serviço. “Desculpa, houve um erro”, respondia a assistente de voz.
Em nota, o Mercado Livre e Mercado Pago reconheceram que houve uma instabilidade em seus aplicativos provocada pela falha do AWS. “Nossas equipes estão trabalhando rapidamente para restabelecer o sistema”, afirma o comunicado oficial.
O PicPay afirmou que seus “serviços estão mais lentos que o comum”. “Como outras instituições financeiras e de entretenimento, o PicPay foi afetado pela instabilidade global nos serviços do AWS. Os serviços estão mais lentos que o comum. As empresas já estão trabalhando em conjunto para resolver o problema o mais rapidamente possível”, diz, em nota oficial.
Os usuários começaram a relatar problemas por volta das 3h30 (horário de Brasília) desta segunda. Às 7h35, a AWS informou que a “maioria das operações de serviços” voltou a funcionar, pediu aos usuários que limpassem o cache e reiniciassem os serviços impactados, mas alertou que falhas “pontuais” ainda estavam ocorrendo.
Às 9h48, a empresa divulgou que havia corrigido outro sistema que caiu, mas que alguns serviços ainda poderiam apresentar lentidão e que a AWS trabalhava para diminuir a fila de solicitações. Parte das empresas afetadas também disseram que os serviços foram restabelecidos. Mas, às 11h14, a AWS relatou nova falha.
A interrupção do AWS é a primeira grande perturbação da internet desde o problema ocasionado por uma atualização do software de segurança CrowdStrike no ano passado, que paralisou sistemas operacionais Windows presentes em hospitais, bancos e aeroportos.
O problema destaca como os serviços digitais se tornaram interconectados e dependentes de um pequeno número de provedores globais de nuvem, segundo especialistas.
“Essa interrupção mais uma vez destaca a dependência que temos de infraestruturas relativamente frágeis”, disse Jake Moore, consultor global de segurança cibernética da empresa europeia de segurança cibernética Eset.
O AWS é líder global em serviços do tipo e uma das principais fontes de receita da Amazon. Analsitas estimam que a divisão deva render US$ 126 bilhões à empresa neste ano. O gigante do ecommercente também investe dezenas de bilhões de dólares na expansão de data centers para treinar e implementar aplicativos com inteligência artificial.
O QUE OCORREU
Os primeiros relatos de falhas começaram por volta das 3h30 (de Brasília). Às 4h11, o AWS informou que investigava “aumento nas taxas de erro e latências” e que trabalhava para o restabelecimento.
Às 5h26, a companhia relatou que o erro impedia que os usuários abrissem ou atualizassem notificações de falhas junto ao suporte do AWS. Cerca de 30 minutos depois, a companhia relatou que a origem seria o servidor na Vírginia do Norte, nos EUA.
“Esses erros ocorrem quando os serviços do AWS não conseguem responder corretamente às requisições de outros sistemas ou aplicativos. E isso traz um impacto em diversas operações. Muitos serviços e aplicações dependem da US-EAST-1 (local onde está a central da Virgínia do Norte)”, comentou Jesaias Arruda, vice-presidente da Abranet (Associação Brasileira de Internet).
Às 6h22, o AWS instruiu os usuários a reiniciar os serviços, que já estavam voltando a funcionar. Em novo comunicado, divulgado às 7h35, o AWS disse que a “maioria das operações de serviços” voltou a funcionar e pediu os usuários que limpassem o cache e reiniciassem os serviços impactados. Porém, a empresa alertou que “falhas pontuais” ainda poderiam ocorrer, apesar de o problema que gerou o DNS (quando o servidor não responde ao pedido do usuário) ter sido corrigido.
“Serviços do AWS que dependem de SQS Lambda como atualização de políticas corporativas também podem estar apresentando lentidão”, afirmou a AWS, em comunicado às 8h48. Cerca de 20 minutos depois, a empresa divulgou que o SQS Lambda fora corrigido e que trabalhava para o restabelecimento de outro sistema que apresentou falha.
Fernando Narazaki/Pedro S. Teixeira/Gustavo Soares/Folhapress
0 Comentários