Atlassian explique enfin la cause de la panne continue du cloud

Atlassian

Atlassian a enfin révélé la cause exacte d’une panne en cours des services cloud qui, selon les estimations de la société, pourrait affecter certains de ses clients jusqu’à deux semaines supplémentaires.

Lorsque nous avons signalé cette panne pour la première fois, Atlassian nous a dit qu’un script de maintenance de routine avait bloqué l’accès de certains clients à leurs données après avoir désactivé « involontairement » les sites d’environ 400 de ses plus de 200 000 clients.

Le script de maintenance efface des centaines de sites clients

Le directeur de la technologie d’Atlassian, Sri Viswanath, a expliqué comment des centaines de sites clients ont été supprimés accidentellement le 5 avril, déclenchant un incident d’une semaine que l’entreprise s’efforce toujours de résoudre.

Comme il l’a expliqué, la panne résultait de problèmes de communication entre deux équipes Atlassian qui travaillaient à la désactivation de l’application autonome héritée « Insight – Asset Management » utilisée par Jira Service Management et Jira Software sur tous les sites clients.

Au lieu de recevoir l’identifiant nécessaire pour désactiver l’application, l’équipe de désactivation a reçu les identifiants des sites cloud sur lesquels l’application était installée.

De plus, le script de maintenance qu’ils ont utilisé pour désactiver l’application a été lancé en utilisant le mauvais mode d’exécution (c’est-à-dire la suppression permanente des données au lieu de la suppression avec récupération).

« Le script a été exécuté avec le mauvais mode d’exécution et la mauvaise liste d’ID. Le résultat a été que les sites d’environ 400 clients ont été supprimés de manière incorrecte », Viswanath expliqué.

Mise à jour sur la panne du cloud Atlassian

Près de 50% des sites supprimés restaurés

La page d’état d’Atlassian était mis à jour jeudi pour dire que ses ingénieurs ont restauré les fonctionnalités pour 49 % des utilisateurs touchés par la panne dans le cadre d’une approche par lots.

Atlassian a initialement estimé que les efforts de restauration ne prendraient pas plus de plusieurs jours, confirmant à EZpublish-france.fr que cette panne n’était pas le résultat d’une cyberattaque.

Cependant, plus tôt cette semaine, la société a révélé dans des e-mails envoyés aux clients concernés que la restauration des sites de tous les utilisateurs concernés prendra probablement jusqu’à deux semaines supplémentaires.

« Nous rétablissons les clients concernés identifiés par un mélange de plusieurs variables, notamment la taille du site, la complexité, l’édition, l’ancienneté et plusieurs autres facteurs par groupes de 60 à la fois », a déclaré la société.

« Le processus de restauration complet implique nos équipes d’ingénierie, nos équipes de support client et notre client. »

Cette panne survient après Atlassian annoncé en octobre 2020 qu’il ne vendra plus de licences pour les produits sur site à partir de février 2021, la prise en charge des licences déjà actives devant être interrompue trois ans plus tard, le 2 février 2024.