Car-tech

Cloudera Preps Hadoop για την επιχείρηση

Joel Selanikio: The surprising seeds of a big-data revolution in healthcare

Joel Selanikio: The surprising seeds of a big-data revolution in healthcare
Anonim

Και οι δύο νέες κυκλοφορίες, καθώς και αρκετές νέες συνεργασίες με τους προμηθευτές των προμηθευτών λογισμικού διαχείρισης δεδομένων, δείχνουν ότι η εταιρεία επιδιώκει να προσφέρει την αναδυόμενη τεχνολογία βάσεων δεδομένων - από τους γίγαντες του Ιστού όπως το Google και το Yahoo - στην επιχειρηματική αγορά ως εναλλακτική λύση στις σχεσιακές βάσεις δεδομένων

. Το στοίχημά μας δεν είναι μόνο οι μεγάλες εταιρίες στο Διαδίκτυο, αλλά οι τράπεζες, τα νοσοκομεία και οι ασφαλιστικές εταιρείες θα ανακαλύψουν ότι πρέπει να αναλύσουν σύνθετα και δομημένα τα στοιχεία μαζί, και Hadoop έγινε για αυτό », δήλωσε ο Cloudera CEO Mike Olson. "Hadoop λύνει ένα νέο πρόβλημα με έναν νέο τρόπο."

Ένας από τους αυξανόμενους αριθμούς μη SQL ή NoSQL βάσεις δεδομένων, Hadoop βασίζεται στο Google MapReduce, ένα πλαίσιο για την επεξεργασία δεδομένων παράλληλα σε μεγάλο αριθμό υπολογιστών κόμβους. Hadoop, που τώρα αναπτύσσεται ως έργο ανοιχτού κώδικα από το Apache Software Foundation, προσφέρει μια εναλλακτική λύση στις παραδοσιακές σχεσιακές βάσεις δεδομένων, τουλάχιστον για εκείνες τις περιπτώσεις ανάλυσης μεγάλων, γρήγορα μεταβαλλόμενων συνόλων δεδομένων.

Μπορεί να λειτουργήσει τόσο με SQL όσο και με μη -SQL και είναι πιο ανθεκτικό στην αποτυχία του διακομιστή από τις σχεσιακές βάσεις δεδομένων, δήλωσε ο Olson.

Η Cloudera είναι η συσκευασία Hadoop για μεσαίες επιχειρήσεις, τόσο με τη διανομή Hadoop όσο και με το νέο εργαλείο διαχείρισης που κυκλοφόρησε. Και τα δύο πακέτα θα πρέπει να επιτρέπουν σε οργανισμούς χωρίς μεγάλη τεχνική εμπειρία στο Hadoop να τρέχουν το λογισμικό, δήλωσε ο Olson. "Υπάρχει αυτός ο μύθος ότι ο Hadoop είναι χρησιμοποιήσιμος εάν διαθέτετε δεδομένα σε κλίμακα Google. Υπάρχουν πολλοί χρήστες που έχουν μόνο μερικά terabytes δεδομένων που επιθυμούν να αναλύσουν", δήλωσε ο Olson.

Η κατανομή Cloudera για Hadoop (CDH) είναι ένα πακέτο ανοιχτού κώδικα από προ-ολοκληρωμένα προγράμματα λογισμικού που χτίστηκε γύρω από το Common Hadoop, που ονομάστηκε προηγουμένως Hadoop Core. Το πακέτο περιλαμβάνει: Κυψέλη, η οποία παρέχει υποδομή αποθήκης δεδομένων. HBase, η βάση δεδομένων της Hadoop. Pig, ένας μεταγλωττιστής για προγράμματα μείωσης των χαρτών. Zookeper, ένας προγραμματισμός για την εκτέλεση εφαρμογών σε πολλούς διακομιστές και το MapReduce.

Στη νεοεκδοθείσα έκδοση 3, το πακέτο περιλαμβάνει τρία προγράμματα που η εταιρεία κυκλοφόρησε ως έργα ανοιχτού κώδικα, υπό την άδεια ανοικτού κώδικα Apache V2. Το ένα είναι το Flume, το οποίο μπορεί να βοηθήσει στην φόρτωση δεδομένων σε Hadoop. Μια άλλη νέα προσθήκη είναι το Oozie, το οποίο είναι ένα λογισμικό διαχείρισης ροής εργασίας. Το τελευταίο είναι ο κώδικας Hadoop User Environment (HUE), ο οποίος παρέχει μια διεπαφή χρήστη για τη διαχείριση του Hadoop.

Το HUE επιτρέπει σε οποιονδήποτε να δημιουργήσει εφαρμογές που απευθύνονται σε αναλυτές και ξέρει πώς να μιλήσει με τους ομίλους Hadoop.

Το πακέτο Cloudera Enterprise αυξάνει την έκδοση CDH 3 με πρόσθετα εργαλεία διαχείρισης. Αυτό το νέο λογισμικό, το οποίο δεν είναι ανοικτού κώδικα, επιτρέπει στους διαχειριστές να ελέγχουν τη διαχείριση της πρόσβασης μέσω της χρήσης του πρωτοκόλλου Lightweight Directory Access Protocol. Προγράμματα παρέχονται επίσης στους πόρους παροχής, για την παρακολούθηση των παραμέτρων και των επιδόσεων.

Η Olson δεν θα συζητήσει πόσο έχει κάνει η Cloudera από τα τέλη συνδρομής και διαβούλευσης μέχρι στιγμής, αλλά σημειώνει ότι το πρώτο τρίμηνο του 2010, τι απέκτησε κατά το ήμισυ του 2009. Μεταξύ των διαφόρων βιομηχανιών, των χρηματοπιστωτικών υπηρεσιών, των τηλεπικοινωνιών, του λιανικού εμπορίου, της κυβέρνησης και των εταιρειών εμπορίου Ιστού έχει δείξει ενδιαφέρον για την τεχνολογία, δήλωσε ο Olson

«Τα πράγματα που κάνουν οι εταιρείες με τον Hadoop ποικίλλουν. γενικά, αυτοί οι άνθρωποι συλλαμβάνουν πολλά δεδομένα από πολλά μέρη και πρέπει να τα υποβάλλουν σε εξελιγμένα αναλυτικά στοιχεία ", δήλωσε ο Olson. "Οι χρηματοπιστωτικές υπηρεσίες ενδιαφέρονται να χρησιμοποιήσουν τον Hadoop για την ανίχνευση απάτης. Στις τηλεπικοινωνίες υπάρχει πραγματική ανάγκη βελτιστοποίησης των δικτύων και περιορισμού των πελατών."

Εκτός από την προσφορά αυτών των πακέτων, η Cloudera υποστηρίζει την υποστήριξη της Hadoop από τους παρόχους BI και του λογισμικού διαχείρισης δεδομένων.

Olson σχεδιάζει να ανακοινώσει, κατά τη διάρκεια της ομιλίας του στη Σύνοδο Κορυφής Hadoop 2010 στη Σάντα Κλάρα, Καλιφόρνια την Τρίτη, ότι ο προμηθευτής BI MicroStrategy θα υποστηρίξει τη χρήση του Hadoop.

Ένας άλλος νέος συνεργάτης είναι η Talend, πωλητής λογισμικού ανοικτής πηγής για την ενσωμάτωση δεδομένων. Η εταιρεία έχει επεκτείνει την εφαρμογή Talend Integration Suite για τη διασύνδεση με βάσεις δεδομένων Hadoop. Η σουίτα της επιτρέπει στους διαχειριστές να διαχειρίζονται και να συγκεντρώνουν πολλαπλές πηγές δεδομένων από μία κονσόλα. Με το Hadoop, το λογισμικό "μπορεί να εισάγει ή να ανακτά δεδομένα και να επεξεργάζεται δεδομένα μέσα στην αρχιτεκτονική του Hadoop", δήλωσε ο Talend αντιπρόεδρος μάρκετινγκ Yves de Montcheuil.

Η Microstrategy και η Talend συμμετέχουν σε έναν αυξανόμενο αριθμό εταιρειών προετοιμάζοντας open source ή εργαλεία εμπορικής διαχείρισης για τον Hadoop. Την περασμένη εβδομάδα, η Cloudera και η Quest ξεκίνησαν ένα έργο κατασκευής λογισμικού που μπορεί να συνδέσει τον Hadoop με τις βάσεις δεδομένων της Oracle. Τον Μάιο, η Pentaho ανακοίνωσε ότι η σουίτα BI θα συνεργαστεί με τις βάσεις δεδομένων Hadoop.

Σε μια ξεχωριστή συνέντευξη με την IDG News Service, ο CTO της Raymie Stata της Yahoo επεσήμανε ότι ο Hadoop θα μπορούσε να μειώσει την ανάγκη κατασκευής υπερυπολογιστών να αναλύσει μεγάλα σύνολα δεδομένων. Παραδοσιακά, έχουν μεταφερθεί μεγάλα σύνολα δεδομένων από την αποθήκευση στον υπερυπολογιστή, ο οποίος είναι ένα συγκεντρωτικό σύνολο διακομιστών, που πρέπει να αναλυθούν. Αντίθετα, ο Hadoop μετακινεί τον αναλυτικό υπολογισμό στις θέσεις όπου βρίσκονται τα δεδομένα, εξαλείφοντας την ανάγκη για μια κεντρική, γιγαντιαία μηχανή τραγάνων αριθμών. Η Yahoo ήταν πρώιμος κορυφαίος συνεργάτης της Hadoop.

Εκτός από την προσφορά της Cloudera, η Hadoop διατίθεται επίσης στο εμπόριο από την IBM, η οποία πρόσφατα άρχισε να προσφέρει μια σειρά αναλυτικών υπηρεσιών που χρησιμοποιούν την τεχνολογία. τεχνολογία που σπάζει νέα για

Η υπηρεσία ειδήσεων IDG

. Ακολουθήστε τον Joab στο Twitter στο @Joab_Jackson. Η διεύθυνση ηλεκτρονικού ταχυδρομείου του Joab είναι [email protected]