Průzkum ITIC 2017-2018 Global Server Hardware, Server OS Reliability Report, provedený napříč platformami zjistil, že nejspolehlivějšími servery jsou mainframy IBM System z, IBM System p a Lenovo System x Servers. Nejlépe vyšel zejména Systém x3850 X6 mission critical server, který je osazován procesory Intel Xeon E7-4800 v4 a E7 8800 v4 a dosahuje pětidevítkové spolehlivosti 99,999 %.
Organizace ITIC provedla mezi respondenty z řad zákazníků průzkum mezi nejvýznamnějšími výrobci serverů a průřezem všemi platformami, a to jak s procesory x86, tak s procesory IBM Power a Oracle Sparc. Mainframe IBM System Z bez jediného výpadku za rok, IBM System P (IBM Power System) a Lenovo System x s 2,1 minutami neplánovaného výpadku za rok. Servery IBM System z (mainframy) prokázaly, že jsou skutečně kategorie fault tolerant, přitom mají odhadovanou dobu neplánovaného výpadku 0,91 – méně než minutu za rok, což se rovná méně než 7,6 vteřinám za měsíc, nebo 1,8 vteřiny za týden – jak se říká „mrkneš a zmeškáš“. Jak IBM, tak Lenovo v posledním průzkumu ITIC dokázaly snížit u serverů System p a System x tuto dobu z původních 2,5 a 2,8 minuty za rok na uvedených 2,1 minuty.
Při vyhodnocení průzkumu také vyplynulo, že 88 % nasazených IBM Power System a 87 % Lenovo System x byly provozovány s RHEL, Suse nebo Ubuntu Linux a dosáhly méně než jedné neplánované odstávky na server a rok.
Servery ostatních výrobců, od Ameriku až po Čínu (Huawei) vykazovaly sedminásobnou a vyšší chybovost, nejhůře pak překvapivě vyšly servery Oracle osazené riscovými procesory Sparc s operačním systémem Solaris (Unix), které u zákazníků vykázaly 16% pravděpodobnost neplánovaného výpadku.
Do průzkumu byly zařazeny servery Cisco UCS, Dell (Poweredge x86), Fujitsu (Primergy a Primequest), HPE (ProLiant a Integrity Superdome), Huawei (Kun Lun), IBM (System x – Power System, System z), Lenovo (System x a ThinkServer), Oracle (x86 a Sparc), Toshiba (Magnia).
Dříve a nyní
Ještě v 90. letech dosahovaly servery x86 dvoudevítkové spolehlivosti (99%), což znamená téměř 88 hodin předpokládaného výpadku ročně, třídevítkový pak 8,76 hodiny. V dnešní době však zákazníci běžně předpokládají pro svoje servery nasazené na „main line of business (LOB) čtyřdevítkovou spolehlivost (99,99 %).
Druhy poruch
ITIC klasifikuje také typy poruch, a to do tří kategorií:
-
Tier 1: Menší, avšak otravné výskyty poruch. Správci sítí je obvykle vyřeší od jedné do 30 minut. Většinou jsou odstraněny rebootováním serveru (lokálně nebo vzdáleně) a zřídka vedou ke ztrátě dat. Také může jít o odpojení serveru a jeho rychlou aktualizaci.
-
Tier 2: Mírné poruchy, při kterých je server offline od jedné do čtyř hodin. Problém Tier 2 už může zaměstnat více než jednoho správce. Uživatelé jsou přitom často odpojeni, což může mít dopad na obchodní partnery, zákazníky a dodavatele. Může dojít ke ztrátě dat a je vyžadována náprava.
-
Tier 3: Nejvážnější incidenty, které mají za následek více než čtyři hodiny nedostupnosti serveru. Vyřešení problému vyžaduje více správců sítě a je zde vyšší pravděpodobnost ztráty dat nebo narušení systému, včetně všech dopadů na organizaci, její zákazníky a obchodní partnery. Incident může být způsoben i výpadkem rozvodné napájecí sítě, přírodní pohromou, prolomením hackery zvenčí, problémy s integrací a interoperabilitou, nebo když IT oddělení nemůže dostat potřebnou technickou podporu od výrobce, nebo když není k dispozici záplata na jinak menší závadu.
Jako jednu z příčin výpadku ITIC samozřejmě uvádí lidský faktor, a sice chybu při konfiguraci, nasazení a správě, nezavedení upgradu, špatný odhad kapacity (sizing) serveru mající dopad na kapacitu dat a výpočetně náročné úlohy, neprovedení aktualizace provozovaných aplikací, které nemusejí ani být podporovány, neprovedení aktualizací záplat a bezpečnosti.
Nejlépe vyšel Lenovo System x Server
IBM prodala divizi serverů System x na platformě x86 společnosti Lenovo v roce 2014 za 2,3 miliardy dolarů. Společnost Lenovo následně udržela stejné úrovně spolehlivosti, jako původní brand IBM. Strategií divize Data Center Group společnosti Lenovo je utužit partnerství s nejvyspělejšími technologickými partnery jako jsou SAP, Nutanix, Juniper a Red Hat, aby mohla uspět na růstových segmentech trhu ve Spojených státech v datových centrech, jehož hodnota se odhaduje na 87 miliard dolarů.
Nejlépe vyšel u téměř tří čtvrtin respondentů ITIC zejména Systém x3850 X6 mission critical server, který je osazován procesory Intel Xeon E7-4800 v4 a E7 8800 v4 a dosahuje pětidevítkové spolehlivosti 99,999 %. Tento server je vybaven řadou prvků a výbavy fault-tolerant, které jsou umístěny s vysokou hustotou zástavby do šasi 4U lid-less (bez víka) optimalizovaném pro rack, aby zabíral menší prostor, potřebný pro podporu masivní síťové výpočetní prostředí a zjednodušení servisu. Server x3850 X6 pojme až čtyři procesory Intel Xeon E7 s celkem 96 jádry (tj. 192 výpočetními vlákny) a 12 TB paměti, aby mohl maximalizovat provoz současně spouštěných vícevláknových aplikací. Je optimalizován pro nasazení v podnicích, které pracují s rozsáhlými „kritickými“ databázemi, případně zpracovávají analýzy Big Data ve virtualizovaném, cloudovém nebo IoT prostředí.
Lenovo kromě toho dodává jednodušší servery řady ThinkServer, které však rovněž dobře uspěly u SMB zákazníků co do spolehlivosti. Po sečtení výsledků odpovědí 87 % zákazníků do průzkumu ITIC vyšla spolehlivost serverů Lenovo ThinkServer na 99,99 %.
Celý průzkum ITIC 2017 – 2018 Global Server Hardware and Server OS Reliability survey.