Windows

Hadoop dostaje więcej wyszukiwań z MapR, wydania Cloudera

Lecture 08 - Hadoop - Why Hadoop need vendors like Cloudera, Hortonworks and MAPR ?

Lecture 08 - Hadoop - Why Hadoop need vendors like Cloudera, Hortonworks and MAPR ?
Anonim

Użytkownicy platformy przetwarzającej dane Hadoop mają teraz dwa dodatkowe narzędzia, które pomogą im w sortowaniu ich informacji.

Nowa dystrybucja M7 MapR usuwa warstwy JVM Hadoop w celu zwiększenia wydajności

Hadoop dystrybutor MapR zintegrował LucidWorks Search z własną dystrybucją. Cloudera, w międzyczasie, uruchomił pierwszą pełną wersję swojego silnika zapytań open source Impala SQL dla Hadoop.

[Więcej informacji: najlepsze usługi streamingowe TV]

"Korzystanie z wyszukiwania jako interfejsu użytkownika dla dużych danych jest bardzo interesujące. Wyszukiwarka dobrze nadaje się do wykorzystywania wielu różnych rodzajów informacji, w szczególności informacji niestrukturalnych "- powiedział Jack Norris, dyrektor ds. Marketingu w MapR. "Widzimy kilka naprawdę interesujących aplikacji z wyszukiwarkami, nawet jeśli typowy użytkownik nie pomyślałby o nich jako o wyszukiwarce."

LucidWorks Search to komercyjna wersja open source Apache Lucene / Solr pełna -tekstowa wyszukiwarka. Dzięki nowej integracji MapR LucidWorks Search może przeszukiwać zarówno dane w systemach plików Hadoop (HDFS), jak i pliki w innych systemach plików.

LucidWorks Search oferuje migawki i kopie lustrzane zapewniające wysoką dostępność i eliminuje znaczną część pracy wymaganej do zainstaluj Lucene / Solr od podstaw. Oferuje również natywne wsparcie dla większej ilości źródeł danych, graficzny interfejs użytkownika i strukturę zabezpieczeń.

Wyszukiwarka może być używana w dynamicznej aplikacji internetowej do szybkiego pobierania zdjęć, reklam, rekomendacji produktów i innych informacji, które mogą być użyte do wypełniania stron internetowych w locie. "To nie jest tańszy substytut hurtowni danych. Chodzi o wykorzystanie nowych źródeł danych i robienie pewnych rzeczy, które mają dramatyczny wpływ na biznes ", powiedział Norris.

MapR i LucidWorks pracują razem nad parowaniem swoich technologii od 2011 roku, kiedy to zawarły wspólną umowę marketingową. Wcześniej w tym roku wypuścili złącze, które ułatwia używanie Lucene / Solr z dystrybucją MapR Hadoop.

LucidWords Search współpracuje z nowo wydaną dystrybucją M7 MapR, w wersji beta. Oprócz obsługi LucidWorks Search, edycja M7 została przeprojektowana, aby wyeliminować kompakty lub kontrole spójności w tle, przyspieszając wydajność.

Również w tym tygodniu Cloudera wydała wersję 1.0 Cloudera Impala, mechanizmu zapytań open source zgodnego z SQL dla Hadoop. SQL jest językiem interfejsu bazy danych używanym w relacyjnych systemach zarządzania bazami danych (RDMS) i jest dobrze znany administratorom baz danych.

Impala został zaprojektowany do wykonywania zapytań szybciej niż Hadoop's Hive, ponieważ nie wykorzystuje struktury MapReduce, która wymaga wyniki wyszukiwania zostaną zapisane na dysku. Zamiast tego użytkownicy mogą bezpośrednio wyszukiwać dane przechowywane w HDFS i HBase. Użytkownicy mogą wysyłać zapytania do danych interaktywnie lub za pomocą procesów wsadowych.

Cloudera jako pierwsza opublikowała wersję tego silnika w październiku jako wersję beta. Od tego czasu oprogramowanie zostało przetestowane przez firmy takie jak 37signals i Expedia.

Impala jest podstawowym elementem pakietu Cloudera Enterprise RTQ (Real-Time Query) dla platformy Cloudera Hadoop. Impala można pobrać bezpłatnie.

Zaktualizowano 6 maja, aby poprawić informacje na temat technologii Cloudera Impala.