• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

SGI Hadoop řešení: přes velká data k porozumění

itbiz
27. 6. 2012
| Články

Big Data jsou reálný problém, se kterým se dnes musí vypořádávat řada společností, od velkých korporací s jejich pobočkami, přes výrobu, finanční sektor (burzy a banky), telekomunikace až po zdravotnictví a vědu či klíčové vládní instituce. Situace je o to horší, že se adekvátní zpracování a datamining obrovského množství nestrukturovaných dat chápe jako samozřejmost. Co si ale počít tam, kde tradiční řešení selhávají?

Na začátek je nutno říci, že Big Data sama o sobě nepředstavují pouze problém, ale také úžasnou příležitost. Porozumění vlastním datům dává firmám konkurenční výhodu. Okamžitý přístup k obrovským objemům dat a jejich analýza v reálném čase radikálně zvyšuje transparentnost. Společnost či instituce se pak může výrazně rychleji rozhodovat a snížit reakční dobu, to umožňuje organizacím bezprostředně reagovat na změny trhu.

Příklady nejčastějšího využití

Altix 8400

Altix 8400

V oblasti high-performance computingu (HPC), což je hlavní působiště společnosti SGI, nejsou rozsáhlé datové objemy žádnou novinkou, má zde několik desetiletí trvající zkušenost a tudíž značný konkurenční náskok.

Dnes se ale čím dál častěji s bigdaty setkáváme také mimo oblast HPC. Jejich primární zdroj dokonce má po ruce prakticky každý, je jím Internet a zejména uživatelsky generovaná data na sociálních sítích, ta představují nedocenitelný poklad například pro nejedno marketingové oddělení.

Pokud se posuneme od Internetu dále na pole vědy, typickým příkladem práce s velkými daty je výzkum klimatu, který může využívat heterogenní, historické údaje za posledních 100 let pro jednu simulační analýzu. Smysl efektivní práce s velkými daty je tedy jasný, jde o to maximalizovat porozumění informačnímu pokladu, který máme po ruce a za použití vhodných analytických nástrojů
pružně reagovat na vědecké, obchodní či průmyslové problémy našeho oboru.

Využití ale podobné nástroje naleznou také třeba v odhalování hospodářské kriminality, čím dál častěji jsou podobné systémy implementovány pro řešení jediného, kritického problému, jako je například odhalování extrémního rozsahu podvodů za použití jedné nebo více novějších analytických metod. Právě pro tyto souvisloti a podobnosti je dnes oblast Big Data vnímána na rozhraní HPC a transakčního zpracování.

Jak na Big data

SGI CloudRack C2

SGI CloudRack C2

Jedním z velmi efektivních a díky svému open source základu také rozhodně ne nejdražších současných přístupů je Hadoop framework pro vytváření datových systémů a pro analýzu dat pomocí rozsáhlých distribuovaných klastrů.

Hadoop je k dispozici jako sada open-sourcových softwarových komponent, které je možné stáhnout na webové stránce hadoop.apache.org.

Apache Hadoop v kombinaci s hardwarem a nadstavbami od SGI představuje unikátní systém pro podnikovou sféru, který dokáže zjednodušit a urychlit nasazení nových technologií pro zpracování informací při současné analýze a optimalizaci výkonu v extrémních zátěžích platformy Hadoop. Ideální je nasazení pro velké objemy dat, které lze snadno rozložit do mnoha menších objemů. SGI k dnešnímu dni nasadila tisíce Hadoop serverů na několika svých systémových architekturách, včetně serverů řady Rackable, CloudRack C2, Altix ICE a 8400.

Jak pracuje Hadoop

Samotný Hadoop se stará o to, že implementuje výpočetní přístup nazvaný MapReduce. V tom je následně celá aplikace rozdělena do velkého množství malých fragmentů úloh, které mohou být spouštěny samostatně bez závislosti na kterémkoli uzlu daného klastru.
Hadoop framework pak transparentně zajišťuje aplikacím stabilitu a permanentní přístup k datům. Vedle toho, nabízí Hadoop ještě jeden benefit a to distribuovaný souborový systém, který ukládá data na výpočetních uzlech, to pak zajišťuje velmi vysokou celkovou propustnost napříč klastrem.

Komponenta MapReduce se pak stará o distribuované zpracování. Je li každá jednotlivá mapovací operace nezávislá na ostatních, mohou být všechny mapovací operace prováděny najednou, i když v praxi jsou limitovány počtem jednotlivých datových zdrojů a/nebo počtem CPU v blízkosti každého zdroje. Samotný MapReduce lze aplikovat na výrazně větší datové soubory, než jaké dokážou zvládnout standardní servery.
Velký klastr zvládne pomocí MapReduce roztřídit data o velikosti petabytu během několika málo hodin. Paralelně také provádí obnovu dat po částečných výpadcích serverů nebo úložišť během operace. Další důležitou komponentou je pak Hadoop Distributed File System (HDFS).

Neexistuje jedna ideální aplikace Hadoopu pro všechny, vše záleží na konkrétních potřebách I/O, paměti a CPU zdrojů. Ideální serverové konfigurace pro klastrové uzly Hadoopu se velmi liší, ale obecně se doporučuje, aby bylo nasazeno nejméně šest, a pokud možno, více jednotek s PCI HBA pro dosažení výkonu. Konkrétní případ je nutné zkonzultovat se společností SGI.

SGI Hadoop Starter Kit

Základní sady SGI Hadoop Starter Kits obsahují veškeré požadované hardwarové i programové vybavení, vše připraveno k okamžitému nasazení, takže lze snadno potvrdit tuto fungující koncepci a rychle je nasadit do funkčního provozu. SGI Hadoop Starter Kits jsou nyní založeny na nových procesorech Intel Xeon E5-2400 a nabízejí 22-ti % nárůst ceny a výkonu ($/TPM) a 27-mi % nárůst výkonu na watt (TPM/W), ve srovnání s předchozí referenční implementací založenou na procesorech Intel Xeon řady 5600. Společně se softwarem od společnosti Cloudera a s vybranými analytickými partnery poskytují SGI Hadoop klastry nyní ještě větší výkon, zkracují dobu potřebnou k zahájení produkce a spolu se systémy se sdílenou pamětí od SGI a s úložnými systémy poskytuje end-to end řešení pro správu dat velkého rozsahu.

Novinka v podobě excelentního výkonu

Nastávající generace SGI platformy se sdílenou pamětí, SGI UV, určená pro vysokorychlostní datově náročné výpočty, je založena na extrémních procesorech Intel Xeon 4600-E5. Uživatelé budou moci využít významného zvýšení výkonu a zároveň se těšit na zjednodušenou správu, konsolidaci aplikací a jednoduchost nasazení, to vše díky škálování v rámci jedné jedinné instance do rozsahu tisíce jader a mnoha terabajtům paměti ve srovnání s alternativami, které vyžadují stovky uzlů. Systém je zcela otevřený, běží na standardních procesorech Intel x86, standardním Linuxu a využívá ihned dostupných aplikací a middlewaru, to vše při zachování vysoké účinnosti a provozuschopnosti.

Procesor Intel Xeon E5-2400 je nyní základním procesorem pro řešení SGI Hadoop Starter Kit a je k dispozici v produktové řadě SGI Rackable pro využití i v dalších aplikacích.

Systém SGI UV se také opět osvědčil ve stávajících světových benchmarcích extrémního výkonu – SPECjbb2005 (rekord celkové propustnosti) a SPECompL2001, s 58% zlepšením na SPECompL2001 oproti předchozí generaci založené na procesorech Intel Xeon E7. Nastávající generace platformy se sdílenou pamětí od SGI také dosáhla nejlepších benchmarků SPECintratebase2006 a SPECfpratebase2006 na 64 socketech Intel Xeon 4600-E5.

Rubriky: HardwarePodnikový software

Související příspěvky

NÚKIB nařizuje aktualizovat MS Exchange Server
Články

58 % firem trápí zdlouhavá oprava softwarových zranitelností

8. 7. 2025
Zákony informatiky: Když Brooksův zákon neplatí
Články

Open source jako klíčové aktivum pro digitální suverenitu

7. 7. 2025
Články

IDC: Trh podnikových sítí WLAN vzrostl meziročně o 10,6 %

4. 7. 2025
Mercedes a SAP posilují spolupráci
Články

Mercedes a SAP posilují spolupráci

3. 7. 2025

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Souhlasím se Zásadami ochrany osobních údajů .

Zprávičky

SpaceX investuje dvě miliardy USD do Muskovy firmy zaměřené na AI

ČTK
13. 7. 2025

Společnost SpaceX podnikatele Elona Muska investuje dvě miliardy dolarů (42 miliard Kč) do jeho

750 zaměstnanců ČSOB se díky Atosu zvládlo rychle přesunout do domácích kanceláří

Google investuje 2,4 miliardy dolarů do technologie AI od start-upu Windsurf

ČTK
12. 7. 2025

Společnost Google ze skupiny Alphabet zaplatí asi 2,4 miliardy USD (50,64 miliardy Kč) za

Muskova xAI chce další peníze od investorů při ohodnocení na 200 miliard dolarů

ČTK
12. 7. 2025

Americká společnost xAI miliardáře Elona Muska plánuje vybrat peníze od investorů v novém kole

Kryptoměny a jejich ekonomika

Bitcoin pokračuje v růstu na další rekordy, překonal hranici 118 000 dolarů

ČTK
11. 7. 2025

Cena bitcoinu dnes pokračuje v prudkém růstu. Kolem 8:30 SELČ se vyšplhala na další

Hackeři ukradli data 5,7 milionu zákazníků australských aerolinek Qantas

ČTK
11. 7. 2025

Hackeři v rámci rozsáhlého kybernetického útoku z minulého týdne ukradli data 5,7 milionu zákazníků

Meta lákala zaměstnance OpenAI na bonus ve výši 100 milionů dolarů

Muskova společnost xAI představila novou verzi chatbota Grok 4

ČTK
11. 7. 2025

Americká společnost xAI miliardáře Elona Muska představila nový model chatbota Grok 4. Ten má

Sophos představil XDR řešení pro synchronizované zabezpečení

Ministerstvo vnitra odhalilo kybernetický útok, údaje občanů neunikly

ČTK
10. 7. 2025

Ministerstvo vnitra odhalilo kybernetický útok na jeden ze systémů úřadu, oznámil dnes na tiskové

Český T-Mobile vyčleňuje vysílače do samostatné firmy

Na Slovensku skončila největší elektronická aukce mobilních frekvencí

ČTK
10. 7. 2025

Na Slovensku včera skončila největší elektronická aukce mobilních frekvencí v historii země. Vynesla rekordní

Tiskové zprávy

Společnost QNAP představuje myQNAPcloud One Beta

Acer slaví několikanásobné ocenění cenou Red Dot Product Design Awards 2025

Acer for Business EMEA překonává růst trhu

Nejnovější modely Acer Chromebook Plus nyní s 12měsíčním balíčkem Google AI Pro včetně služby NotebookLM zdarma

ANECT mění vedení společnosti a posiluje management

Optimize by Acer: nejnovější evoluce v oblasti podnikových záručních podmínek

Zpráva dne

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Redakce
15. 5. 2025

Kupte Windows 11 CDkey od Goodoffer24.com a můžete růst s tímto OS jak při...

Komentujeme

Chvála černých skřínek

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které...

Slovník

Makléř

Computer operator

Brand manager

Nejpopulárnější články

Žádný obsah není dostupný

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia. Hosting zajišťuje společnost Greenhousing.cz. Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace Veřejná správa Vývoj a HTML Zpráva dne České IT
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.