Car-tech

Οι μηχανικοί Facebook εντοπίζουν τις μεγάλες προκλήσεις δεδομένων του Graph Search

Disruption - Day 1 - Part 1 (ENG)

Disruption - Day 1 - Part 1 (ENG)
Anonim

Οι μηχανικοί του Facebook έχουν πολλές προκλήσεις μπροστά τους καθώς εργάζονται για την κλιμάκωση της Graph Search, του νέου εργαλείου κοινωνικής αναζήτησης του ιστότοπου. Ένα εμπόδιο: μια υπερβολική αφθονία των δεδομένων για να κοσκινίσει.

Πάρτε το παράδειγμα της αναζήτησης για τα ιαπωνικά εστιατόρια στη Νέα Υόρκη όπως τους ανθρώπους από την Ιαπωνία. Μια αναζήτηση που φαίνεται να παράγει εκατοντάδες, αν όχι χιλιάδες αποτελέσματα, επιστρέφει μόνο σε δυο ριψοκίνδυνες επιχειρήσεις.

Η μηχανή αναζήτησης, στην τρέχουσα μορφή beta, απλά δεν έχει την ικανότητα επεξεργασίας να κοσκινίσει τα εκατομμύρια των συνδέσεων μεταξύ των ιαπωνικών στο site για να πραγματοποιήσουν την αναζήτηση, ανέφεραν οι μηχανικοί του Facebook την Πέμπτη κατά τη διάρκεια μιας μικρής ενημέρωσης των μέσων ενημέρωσης στην έδρα της εταιρείας στο Menlo Park, Καλιφόρνια.

Kerry Davis, IDGNSMike Curtiss, μηχανικός στο Facebook, περιγράφει το ιστορικό της Graph Search, το οποίο τροφοδοτείται από μια μηχανή αναζήτησης που καλεί το Facebook Unicorn.

«Υπάρχει ακόμη πολλή δουλειά που πρέπει να κάνουμε», δήλωσε ο μηχανικός λογισμικού Michael Curtiss. "Ένα τέτοιο ερώτημα είναι πολύ δύσκολο υπολογιστικά", για να ξεκινήσετε με τα 100 εκατομμύρια στην Ιαπωνία, και έπειτα σε λίγα δευτερόλεπτα για να ταξινομήσετε όλες τις σελίδες που τους αρέσουν οι άνθρωποι στην Ιαπωνία, δήλωσε. που δεν μπορεί να αντιμετωπιστεί στο περιορισμένο χρονικό διάστημα που έχουμε ", δήλωσε ο μηχανικός, ο οποίος βοήθησε στο σχεδιασμό της μηχανής αναζήτησης Unicorn του ιστότοπου που παρέχει την υποδομή Graph Search. "Αυτό που καταλήγουμε να κάνουμε είναι να αποκόψουμε πιθανώς καλά αποτελέσματα."

Ο Kerry Davis, το υποστηρικτικό υπόβαθρο αναζήτησης του IDGNSFacebook ονομάζεται Unicorn από την εταιρεία. Μέσα σε αυτό, στους τύπους άκρων αποδίδεται ένας αριθμός. Εδώ εμφανίζεται ο αριθμός των φίλων που λειτουργεί ως λέξη-κλειδί στο εσωτερικό του συστήματος στην κάτω αριστερή πλευρά της οθόνης.

Το Facebook χρησιμοποιεί διάφορες προσεγγίσεις για να λύσει αυτό το πρόβλημα και άλλα μεγάλα προβλήματα δεδομένων που σχετίζονται με την Αναζήτηση Γραφήματος.

Μια στρατηγική περιλαμβάνει μια έννοια σε βάσεις δεδομένων υπολογιστών γνωστή ως "βελτιστοποίηση ερωτήματος", για τη βελτίωση της ταχύτητας και της αποτελεσματικότητας ορισμένων τύπων αναζητήσεων.

Στην περίπτωση της ιαπωνικής αναζήτησης εστιατορίων, η τεχνική θα μπορούσε να εφαρμοστεί για να ξεκινήσει πρώτα με τα εστιατόρια που τους αρέσουν, αντί να ξεκινούν με την Ιαπωνία και στη συνέχεια να φιλτράρουν τα likes από τους ανθρώπους, ανέφεραν οι μηχανικοί του Facebook

Η εταιρεία αντιμετωπίζει επίσης τις προκλήσεις σε επίπεδο υλικού, προσθέτοντας πρόσθετη μνήμη flash και άλλα νέα χαρακτηριστικά στο servers που χρησιμοποιεί στα κέντρα δεδομένων, ώστε να καταστεί δυνατή η αύξηση της επισκεψιμότητας αναζήτησης που προκαλείται από την αναζήτηση γραφήματος.

"Πρέπει να κάνουμε επιπλέον εργασίες στα κέντρα δεδομένων, αγοράζοντας νέες πλατφόρμες υλικού, [με] νέους τύπους εξυπηρετητών που υποστηρίζονται «Οι υπολογιστικές ανάγκες του Unicorn», δήλωσε ο Σόρεν Λάσεν, ο οποίος ηγήθηκε της ομάδας έρευνας στην αναζήτηση Graph Graph.

Το Facebook άρχισε να κυκλοφορεί τον Graph Search τον περασμένο μήνα σε περιορισμένο αριθμό χρηστών στις Η.Π.Α. Το εργαλείο αναζήτησης έχει σχεδιαστεί για να αφήνει τους ανθρώπους χτυπήστε μέσα από το 1 τρισεκατομμύριο συνδέσεις του κοινωνικού δικτύου μεταξύ των χρηστών για να αναζητήσετε άτομα, μέρη, φωτογραφίες και ενδιαφέροντα χρησιμοποιώντας φράσεις σε απλά αγγλικά

Κατ 'αρχήν, τίποτα δεν μπορεί να εμποδίσει τους χρήστες να πληκτρολογήσουν ένα ερώτημα που είναι ασυνήθιστα μεγάλο, όπως " των φίλων των φίλων μου που ζουν στη Νέα Υόρκη και τους αρέσει το

Downton Abbey, ανέφεραν οι μηχανικοί, δεδομένου ότι η Graph Search χρησιμοποιεί δείγματα όπως "Likes" και check-in για να κατατάσσουν καλύτερα τα αποτελέσματα Τελικά η Αναζήτηση με Γραφήματα θα ενσωματώσει άλλες μετρήσεις όπως τα σχόλια των χρηστών και τις ενημερώσεις κατάστασης για να συγκεντρώσουν και να ταξινομήσουν τα αποτελέσματα, αλλά αυτό είναι πιο κάτω από τη γραμμή, δήλωσε η εταιρεία