Windows

Cloud & Services

Introduction to Amazon Web Services by Leo Zhadanovsky

Introduction to Amazon Web Services by Leo Zhadanovsky
Anonim

Οι χρήστες της πλατφόρμας επεξεργασίας δεδομένων Hadoop έχουν τώρα άλλα δύο εργαλεία για να τους βοηθήσουν να ταξινομήσουν τα βουνά τους.

Η νέα κατανομή M7 του MapR αφαιρεί τα επίπεδα Hadoop JVM για να αυξήσει την απόδοση

Hadoop ο διανομέας MapR έχει ενσωματώσει την αναζήτηση LucidWorks στη δική της διανομή. Η Cloudera, εν τω μεταξύ, ξεκίνησε την πρώτη πλήρη κυκλοφορία της μηχανής ερωτημάτων της ανοιχτής πηγής Impala SQL για την Hadoop.

"Η αναζήτηση ως διεπαφή χρήστη για μεγάλα δεδομένα είναι πολύ ενδιαφέρουσα. Η αναζήτηση είναι κατάλληλη για την αξιοποίηση πολλών διαφορετικών τύπων πληροφοριών, ιδιαίτερα αδόμητων πληροφοριών », δήλωσε ο Jack Norris, επικεφαλής μάρκετινγκ για το MapR. "Βλέπουμε κάποιες πραγματικά ενδιαφέρουσες εφαρμογές με μηχανές αναζήτησης στον πυρήνα τους, ακόμα κι αν ένας τυπικός χρήστης δεν θα σκεφτόταν τους ως κινητήρια μηχανή αναζήτησης."

LucidWorks Search είναι η εμπορική έκδοση του Open source Apache Lucene / Solr πλήρης -text μηχανή αναζήτησης. Με την νέα ενσωμάτωση MapR, η LucidWorks Search μπορεί να πραγματοποιήσει αναζήτηση είτε στα δεδομένα των συστημάτων αρχείων Hadoop (HDFS) είτε σε αρχεία σε άλλα συστήματα αρχείων.

Η LucidWorks Search προσφέρει στιγμιότυπα και καθρέφτες για υψηλή διαθεσιμότητα και εξαλείφει μεγάλο μέρος της εργασίας που απαιτείται Εγκαταστήστε Lucene / Solr από το μηδέν. Η μηχανή αναζήτησης μπορεί να χρησιμοποιηθεί σε μια δυναμική εφαρμογή Ιστού για την γρήγορη ανάκτηση φωτογραφιών, διαφημίσεων, συστάσεων προϊόντων και άλλων πληροφοριών που μπορούν να χρησιμοποιηθούν για να πλημμυρίσει ιστοσελίδες εν πτήσει. "Αυτό δεν είναι υποκατάστατο χαμηλότερου κόστους για αποθήκες δεδομένων. Πρόκειται για την αξιοποίηση νέων πηγών δεδομένων και την πραγματοποίηση ορισμένων πράξεων που έχουν δραματικές επιπτώσεις στην επιχείρηση ", ανέφερε ο Norris.

Η MapR και η LucidWorks συνεργάζονται για την αντιστοίχιση των τεχνολογιών τους από το 2011, όταν συνήψαν μια κοινή συμφωνία μάρκετινγκ. Νωρίτερα φέτος, κυκλοφόρησαν ένα σύνδεσμο που διευκολύνει τη χρήση της Lucene / Solr με τη διανομή MapR Hadoop.

Η LucidWords Search συνεργάζεται με την κυκλοφορία του M7 που κυκλοφόρησε το MapR, σε beta μορφή. Εκτός από την υποστήριξη της LucidWorks Search, η έκδοση M7 έχει ανασυγκροτηθεί για την εξάλειψη των συμπαγών ελέγχων ή των ελέγχων συνέπειας του περιβάλλοντος, επιταχύνοντας την απόδοση.

Επίσης αυτή την εβδομάδα, η Cloudera κυκλοφόρησε την έκδοση 1.0 του Cloudera Impala, Hadoop. Το SQL είναι η γλώσσα διεπαφής της βάσης δεδομένων που χρησιμοποιείται στα συστήματα διαχείρισης σχεσιακών βάσεων δεδομένων (RDMS) και είναι γνωστή από τους διαχειριστές βάσεων δεδομένων.

Η Impala σχεδιάστηκε για να εκτελεί ερωτήματα ταχύτερα από την Hiveop's Hive, διότι δεν χρησιμοποιεί το πλαίσιο MapReduce, τα αποτελέσματα αναζήτησης που θα εγγραφούν στο δίσκο. Αντ 'αυτού, οι χρήστες μπορούν να αναζητήσουν δεδομένα αποθηκευμένα απευθείας σε HDFS και HBase. Οι χρήστες μπορούν να αναζητήσουν δεδομένα είτε διαδραστικά είτε μέσω διαδικασιών δέσμης.

Η Cloudera κυκλοφόρησε για πρώτη φορά μια έκδοση αυτής της μηχανής τον περασμένο Οκτώβριο ως beta. Από τότε, το λογισμικό έχει δοκιμαστεί από εταιρείες όπως το 37signals και το Expedia.

Το Impala είναι το βασικό συστατικό του συμπληρωματικού πακέτου Cloudera Enterprise RTQ (Real-Time Query) για την πλατφόρμα Cloudera Hadoop. Η Impala μπορεί να μεταφορτωθεί χωρίς κόστος

Ενημερώθηκε στις 6 Μαΐου για να διορθωθούν οι πληροφορίες σχετικά με την τεχνολογία Cloudera Impala