Na sexta -feira (13), o Google pediu desculpas por um grande acidente que, segundo a empresa, foi causado por várias camadas de falhas recentes com falha. A empresa divulgou um relatório de incidente no final da sexta -feira que explicou as horas de inatividade na quinta -feira (12).
O acidente interrompeu dezenas de serviços de terceiros, como Cloudflare, Openai e Shopify. O Google disse que também auditará todos os sistemas e melhorará seus “automatizados e humanos, para que nossos clientes recebam informações de que precisam o mais rápido possível para reagir aos problemas”.
O CEO do Google Cloud, Thomas Kurian, fala de uma conferência de computação em nuvem realizada pela empresa em 2019.
O Google pediu desculpas por um grande acidente que, de acordo com a empresa, foi causado por várias camadas de falhas recentes com falha. A empresa divulgou um relatório de incidentes no final da sexta -feira que explicou as horas de inatividade na quinta -feira.
Mais de 70 serviços do Google Cloud pararam de funcionar corretamente em todo o mundo, batendo ou interrompendo dezenas de serviços de terceiros, incluindo CloudFlare, Openai e Shopify. Gmail, Google Agenda, Google Drive, Google Meet e outros produtos próprios também tiveram mau funcionamento.
Leia mais:
Os serviços do Google Cloud e Hosting sofrem instabilidade – ChatGPT, Shopify e outros foram afetados
As pessoas mais inteligentes e de sucesso que conheço fazem essas perguntas “poderosas”, diz o ex -executivo do Google
“Pedimos desculpas pelo impacto desse colapso”, escreveu o Google no relatório do incidente. “Os clientes em nuvem e seus usuários confiam em seus negócios no Google, e vamos melhorar. Pedimos desculpas pelo impacto que isso não apenas teve nos negócios de nossos clientes e em seus usuários, mas também em confiança em nossos sistemas. Estamos comprometidos em fazer melhorias para ajudar a evitar acidentes como essa no futuro”.
Kurian também comentou o painel em um post X na quinta -feira, dizendo: “Lamentamos a interrupção que isso causou aos nossos clientes”.
Detalhes dos incidentes
Em maio, o Google adicionou um novo recurso às suas “verificações de políticas de cotas” para avaliar solicitações automáticas recebidas, mas o novo recurso não foi testado imediatamente em situações reais do mundo, escreveu a empresa no relatório do incidente.
Como resultado, os sistemas da empresa não sabiam como lidar adequadamente com os novos dados de recursos, que incluíam entradas em branco. Essas entradas em branco foram enviadas a todas as regiões dos data centers do Google Cloud, o que causou as falhas, escreveu a empresa.
Os engenheiros identificaram o problema em 10 minutos, segundo a empresa. No entanto, todo o incidente se estendeu por sete horas depois disso, com a falha levando a uma sobrecarga em algumas regiões maiores.
Ao lançar o recurso, o Google não usou “sinalizadores de recursos”, uma prática cada vez mais comum no setor que permite que a implementação lenta minimize o impacto se ocorrer problemas. Os “sinalizadores de recursos” teriam detectado o problema antes que o recurso se tornasse amplamente disponível, disse o Google.
Ações futuras
No futuro, o Google mudará sua arquitetura para que, se um sistema falhar, ele ainda poderá operar sem cair, informou a empresa. O Google disse que também auditará todos os sistemas e melhorará seus “automatizados e humanos, para que nossos clientes recebam informações de que precisam o mais rápido possível para reagir aos problemas”.
–
Onde assistir o maior canal de negócios do mundo no Brasil:
Canal 562 CLAROTV+ | Canal 562 céu | Canal 592 Vivo | Canal 187 Oi | Operadores regionais
Sinal aberto da TV: canal parabólico 562
Online: www.timesbrasil.com.br | YouTube
Canais rápidos: Samsung TV Plus, Canais LG, Canais TCL, Plutão TV, Roku, Soul TV, Zapping | Novos streamings
Este conteúdo foi fornecido por CNBC International e a responsabilidade exclusiva pela tradução portuguesa é do Times Brasil.