Συστατικά

Aster Data Updates 'frontline' Αναλυτική Βάση Δεδομένων

Anil Gupta: India's hidden hotbeds of invention

Anil Gupta: India's hidden hotbeds of invention
Anonim

κυκλοφόρησε την έκδοση 3.0 της αναλυτικής βάσης δεδομένων nCluster της την Τρίτη, διαμορφώνοντάς την ιδανική για την αποθήκευση δεδομένων "frontline".

"Παραδοσιακά, σκεφτόμαστε την αποθήκευση δεδομένων ως εργασία back-office", γράφει ο διευθύνων σύμβουλος της Aster Mayank Bawa σε ένα blog μετά την Τρίτη. "Η αποθήκη δεδομένων μπορεί να φορτωθεί σε ξεχωριστά παράθυρα φορτίου, τα φορτία μπορούν να τρέξουν αργά (το καθαρό αποτέλεσμα είναι ότι οι επιχειρηματικοί χρήστες θα πάρουν τις αναφορές τους καθυστερημένοι), τα φορτία, τα αντίγραφα ασφαλείας και η κλιμάκωση μπορούν να πάρουν αποθήκες δεδομένων εκτός σύνδεσης - "Οι πελάτες της Aster, που περιλαμβάνουν aCerno, ένα δίκτυο διανομής διαδικτυακών διαφημίσεων," βασίζονται σε αναλυτικά στοιχεία για τα έσοδά τους ", δήλωσε ο Μπάουα.

Το nCluster 3.0 του Aster απλώνει φορτία σε πολλούς διακομιστές και διευκολύνει την προσθήκη επιπλέον μηχανών για περισσότερη ισχύ. Το λογισμικό επίσης χωρίζει τα διάφορα συστατικά ενός φόρτου εργασίας ανάλυσης δεδομένων σε διακριτά κομμάτια.

Μια βαθμίδα "loader" ασχολείται με τη φόρτωση και την εξαγωγή δεδομένων προς και από εξωτερικές πηγές. ένα "εργαζόμενο" στρώμα αποθηκεύει δεδομένα σε τοπικά συνδεδεμένους δίσκους για επερώτηση. και ένα στρώμα κόμβων "βασίλισσας" εκτελεί έξυπνο σχεδιασμό και επεξεργασία ερωτημάτων

Εν τω μεταξύ, οι χρήστες συνεργάζονται με το σύμπλεγμα σαν να ήταν μια ενιαία οντότητα.

Η δυνατότητα επιλεκτικής κλίμακας τμήματα του συμπλέγματος σημαίνει ότι οι χρήστες μπορούν να προσθέσουν πόρους Σε αυτές τις βασικές δυνατότητες, η απελευθέρωση 3.0 προσθέτει μια σειρά από λειτουργίες για "πάντοτε" χρήση, συμπεριλαμβανομένης της δυνατότητας προσθήκης χωρητικότητας, επαναφόρτισης δεδομένων και ανάκτησης δεδομένων, ενώ οι λειτουργίες που απαιτούνται είναι οι εξής:

Ο Aster εργάστηκε επίσης για να προσθέσει παραλληλισμό σε όλο το σύστημα, σύμφωνα με έναν υπάλληλο της εταιρείας

«Θέλουμε να δημιουργήσουμε συστήματα που να μπορούν να χειριστούν 10x, 100 φορές περισσότερα δεδομένα από οποιοδήποτε άλλο σύστημα σήμερα. πολλά δεδομένα για κάθε διακομιστή βασικών προϊόντων ", δήλωσε ο CTO Tasso Argyros σε μια θέση blog. "Έτσι, βάζουμε πολλή προσπάθεια Ε & Α σε παραλληλισμό με όλες τις λειτουργίες του συστήματος - όχι μόνο ερωτήματα, αλλά και φόρτωση, εξαγωγή δεδομένων, δημιουργία αντιγράφων ασφαλείας και αναβαθμίσεις. Επιπλέον, επιτρέπουμε στους χρήστες μας να επιλέξουν πόσο θέλουν να παραλληλιστούν "

Η έκδοση περιλαμβάνει επίσης υποστήριξη για MapReduce, μια τεχνική προγραμματισμού που αναπτύχθηκε αρχικά από την Google, η οποία διευκολύνει τους προγραμματιστές να γράφουν προγράμματα για την ανάλυση μεγάλων συνόλων δεδομένων. Ο ανταγωνιστής της Aster Greenplum ανακοίνωσε επίσης πρόσφατα την υποστήριξη του MapReduce.

Επιπλέον χαρακτηριστικά περιλαμβάνουν τη δυνατότητα επιλογής επιπέδων συμπίεσης δεδομένων για μεμονωμένους πίνακες, εργαλείο αναβάθμισης με ένα κλικ. και τα καλύτερα χαρακτηριστικά ασφαλείας, όπως το πρωτόκολλο LDAP (Lightweight Directory Access Protocol) για τον έλεγχο ταυτότητας και η δυνατότητα διαχείρισης δικαιωμάτων προφίλ σε επίπεδο συμπλέγματος, βάσης δεδομένων και επιτραπέζιου δικτύου.

Πολλοί από τους αρχικούς πελάτες της Aster, οι οποίοι περιλαμβάνουν επίσης το MySpace,, δήλωσε ο Curt Monash, πρόεδρος της Monash Research

"Ένα τεράστιο κλάσμα της ανάπτυξης και της ευκαιρίας στην αποθήκευση δεδομένων έγκειται στην αντιμετώπιση σχετικά νέων δεδομένων", ανέφερε. "Υπάρχουν μεγάλες αποθήκες δεδομένων που ασχολούνται με τα παραδοσιακά OLTP, δεδομένα συναλλαγών, αλλά η Aster δεν είναι αναγκαστικά ο κορυφαίος ανταγωνιστής στην ανάλυσή της. Το γλυκό σημείο στην ανάλυση μεγάλων ποσοτήτων δεδομένων είναι επί του παρόντος δεδομένα του Παγκόσμιου Ιστού και σχετικές εκδηλώσεις δικτύου."

διαχείριση παράλληλης επεξεργασίας και υποστήριξη για το MapReduce ως βασικά πλεονεκτήματα του Aster: "Το Aster είναι μια εκκίνηση με ένα σχετικά ανώριμο προϊόν, αλλά έχουν σκεφτεί πολλά για την εύκολη διαχείριση της παράλληλης επεξεργασίας."

Το NCluster 3.0 τρέχει σε τυπικούς διακομιστές x86. Η τιμολόγηση βασίζεται στο ποσό της διαχείρισης των δεδομένων. Η εταιρεία ανέφερε προηγουμένως ότι το κόστος ξεκινά από 100.000 δολάρια ΗΠΑ