Strony internetowe

Przestój w szafie ma ograniczony wpływ

S01E14 - Patchpanel w szafie rack | Jak zrobić porządek z kablami? | Jaki domofon do domu?

S01E14 - Patchpanel w szafie rack | Jak zrobić porządek z kablami? | Jaki domofon do domu?
Anonim

przerwa w tym roku - powtarzający się w tym roku problem dla hostowanego dostawcy centrum danych - które zaowocowało wieloma wysokimi witrynami, w tym popularną witryną TechCrunch na blogu. Żadna sieć nie jest odporna na awarie, ale firma taka jak Rackspace musi zapewniać spójne i niezawodne usługi.

Oficjalny blog Rackspace wyjaśnia: "18 grudnia 2009, między 15:37 a 16:12 czasu CST, Rackspace doświadczył łączności sieciowej problemy. " Oś czasu nie jive z faktem, że znacznik czasu w raporcie TechCrunch na stronie Washington Post mówi 12:17. Zakładając, że znacznik czasu TechCruncha przypada na czas pacyficzny, oznaczałoby to, że przerwa trwała około godziny 14:00 czasu centralnego, a może nawet wcześniej.

Oprócz TechCrunch wiele innych serwisów i blogów miało wpływ na przestój w Rackspace, w tym 37signals, Brizzly, blog Roberta Scoble, witryny hostowane przez Laughing Squid, Tumblr i Mashable.

[Dalsze informacje: Najlepsze pudełka NAS do strumieniowego przesyłania multimediów i kopii zapasowych]

Blog Rackspace opisuje główną przyczynę: "Problemy wynikły z problem z routerem wykorzystywanym do połączeń peeringowych i szkieletowych zlokalizowanych poza centrum danych w obiekcie peering, który obsługuje około 20% ruchu Dack w Rackspace. "

Wpis na blogu wyjaśnia, że ​​błąd konfiguracji routera był częścią ostateczne testy integracji centrum danych między obiektami w Chicago i Dallas oraz fakt, że nie powinno to mieć wpływu na działanie w normalnych godzinach pracy. "Integracja sieci urządzeń miała się odbyć podczas miesięcznego przeglądu poza godzinami pracy, a dzisiejszy incydent miał miejsce podczas końcowych przygotowań."

W wyniku awarii wielu klientów Rackspace powiedziało "Hej! Kto wyłączył chmurę? "

O ile przerwa w centrum danych, która ma wpływ na popularne i dobrze znane witryny, jest ogólnie rzecz biorąc szkodliwa dla chmury obliczeniowej, zakres oddziaływania tej awarii był stosunkowo niewielki. Jak pokazuje ten blog: "Rackspace to małe ziemniaki, teraz jest to szybko rosnący worek ziemniaków, ale wciąż dinky, a drugi haczyk: Rackspace to raczej hosting niż chmura."

Dla klientów, którzy polegają na Rackspace na hosta ich serwery - zwłaszcza serwery WWW - mogą wydawać się bardzo podobne do tego, że Internet przestał działać, gdy centrum danych Rackspace było niedostępne. Jednak usługi przetwarzania w chmurze, takie jak Amazon EC2 i Microsoft Azure, a także kluczowe elementy Internetu, takie jak Google czy Amazon, nie zostały w ogóle dotknięte awarią Rackspace.

Błędy zdarzają się, ale klienci Rackspace mają prawo do kwestionowania powtarzających się awarii i usług przerwy. Co najmniej jeden klient usługi Rackspace jest także zaniepokojony powiązanym problemem dotyczącym powiadamiania klientów o problemach z siecią, takich jak ta przerwa.

Serwery hostowane przez klienta zostały dotknięte awarią Rackspace i dowiedziały się na podstawie skarg klientów, że jej witryna była niedostępna dla dwóch osób. godziny. W komentarzu klient stwierdził: "Płacimy dodatkowo Rackspace za stałą usługę monitoringu, która ma natychmiast powiadomić mnie e-mailem lub telefonicznie, jeśli nasz serwer stanie się niedostępny w dowolnym momencie.BARDZIE przeszkodziłem, aby dowiedzieć się, że Rackspace faktycznie jest SUPRESSIONE powiadomienia te nie są wysyłane do klientów z jakiegoś dziwnego powodu. "

Komentarz nie zawiera żadnych dowodów na poparcie twierdzenia, że ​​Rackspace umyślnie wstrzymywał powiadomienia, a ja nie otrzymałem od Rackspace żadnych informacji zwrotnych w celu potwierdzenia lub odrzucenia oskarżenia. Jeśli okaże się to prawdą, zaszkodziłoby to wiarygodności Rackspace i reputacji obsługi klienta.

Najważniejsze jest to, że Rackspace określił przyczynę problemu i naprawił ją stosunkowo szybko, i dostarczył aktualizacje statusu na blogu aby informować klientów. Nawet krótkie przerwy w działaniu wydają się być katastrofalne dla osób nimi dotkniętych, ale tak się stanie, a kiedy to zrobią, to w zasadzie zależy od tego, jak chcesz, aby były obsługiwane.

Tony Bradley wpisuje tweety jako @PCSecurityNews, i można się z nim skontaktować na swojej stronie na Facebooku.