Ιστοσελίδες

Το νέο λογισμικό εντοπίζει τα στοιχεία αποτύπωσης ιστοτόπων Web

Disruption - Day 1 - Part 1 (ENG)

Disruption - Day 1 - Part 1 (ENG)
Anonim

Οι τοποθεσίες Web, όπως οι πίνακες εργασίας, αντιμετωπίζουν ένα επίμονο πρόβλημα: τα δεδομένα τους αποβάλλονται συνεχώς από αυτοματοποιημένα bots.

Τα δεδομένα καταλήγουν σε άλλους ανταγωνιστικούς πίνακες εργασίας που έχουν κλέψει το περιεχόμενο. Είναι ένα πρόβλημα που πλήττει οποιονδήποτε ιστότοπο, του οποίου η πνευματική ιδιοκτησία πρέπει να δημοσιεύεται δημόσια δωρεάν, ή ακόμα και εκείνους με μοντέλα συνδρομής.

Ωστόσο, μια εταιρεία ασφάλειας που βασίζεται στην Ατλάντα και ειδικεύεται στην ανίχνευση bots έχει αναπτύξει λογισμικό που μπορεί να ανιχνεύσει αυτές τις αποκοπές οθόνης και το bots για την εξόρυξη δεδομένων

Το βασικό προϊόν της Pramana, το HumanPresent, εντοπίζει αυτοματοποιημένα bots που, για παράδειγμα, εισάγουν ανεπιθύμητα μηνύματα σε έντυπα που βασίζονται στο Web ή εγγράφονται δωρεάν οι λογαριασμοί ηλεκτρονικού ταχυδρομείου που χρησιμοποιούνται για ανεπιθύμητα μηνύματα.

Η Pramana έχει αναπτύξει τώρα ένα module που ονομάζεται "εξόρυξη δεδομένων και πρόληψη απόσπασης οθόνης" για το HumanPresent. Λειτουργεί σε πολλές από τις ίδιες αρχές όπως το κύριο προϊόν της, αλλά έχει τροποποιηθεί για σενάρια εξόρυξης δεδομένων, δήλωσε ο David Crowder, CEO της Pramana.

Το HumanPresent μπορεί να ανιχνεύσει bots εντοπίζοντας διαφορές στον τρόπο με τον οποίο ο άνθρωπος θα αλληλεπιδρά κανονικά με έναν ιστό σελίδα και αντίθετα με το πώς συμπεριφέρονται τα bots. Εμφανίζει περισσότερες από 30 μετρήσεις, όπως τα πλήκτρα του πληκτρολογίου, τα κλικ του ποντικιού και το χρονοδιάγραμμα αυτών των ενεργειών.

Το HumanPresent εξετάζει μεμονωμένες συναλλαγές, αλλά η ενότητα εξόρυξης δεδομένων έχει τροποποιηθεί για να εξετάσει μια χρονική περίοδο όταν ένα bot ή ο άνθρωπος είναι στην τοποθεσία, δήλωσε ο Crowder.

Οι βόμβες εξόρυξης δεδομένων τείνουν να παρακάμπτουν εξ ολοκλήρου τη διεπαφή χρήστη του προγράμματος περιήγησης. Για παράδειγμα, ένα bot μπορεί να ζητήσει μια ιστοσελίδα με πολλά και πολλά δεδομένα, αλλά ποτέ να μην μετακινηθεί ή να κάνει κλικ σε μια σελίδα. Εάν μια σειρά σελίδων ανοίξει και προβληθεί με αυτόν τον τρόπο, θα μπορούσε να σημαίνει ότι έχει φτάσει ένα bot bot για την εξόρυξη δεδομένων.

Η Pramana αποδίδει στον επισκέπτη ένα μοναδικό αναγνωριστικό και μετά την ανάλυση της συμπεριφοράς του επισκέπτη, ο επισκέπτης ένα bot ή όχι. Υπάρχουν διάφοροι τρόποι με τους οποίους ένας διαχειριστής ιστότοπου μπορεί στη συνέχεια να επιλέξει να αντιμετωπίσει την κατάσταση.

Η διεύθυνση IP (Internet Protocol) του υπολογιστή του bot μπορεί να αποκλειστεί μόνιμα. Ένας δικτυακός τόπος δημοπρασίας αυτοκινήτων που δοκιμάζει τη μονάδα εξόρυξης δεδομένων της Pramana αποφάσισε να μετακινήσει ύποπτους bots σε ένα "sandbox" όπου εξυπηρετούνται εντελώς ψευδή δεδομένα.

Άλλες επιλογές περιλαμβάνουν την προτροπή του επισκέπτη στο Web με μια πρόκληση ή μια εργασία, την οποία μερικοί bots δεν είναι σε θέση να ολοκληρώσουν.

Η εξόρυξη δεδομένων κοστίζει πολύ τις εταιρείες. Οι εταιρείες που πωλούν δεδομένα υψηλής ποιότητας θα διαπιστώσουν ότι οι ανταγωνιστές τους θα αγοράσουν μια συνδρομή και στη συνέχεια θα χρησιμοποιούν αυτοματοποιημένα bots για να κλέψουν τα δεδομένα για τους δικούς τους ιστότοπους. Σε ένα παράδειγμα, ένας ιστότοπος με gigabytes δεδομένων σχετικά με τις τιμές των μεταχειρισμένων αυτοκινήτων διαπίστωσε ότι τα δεδομένα τους είχαν ξαναξεκινήσει και ήταν προς πώληση στο eBay.

«Ανταγωνίζονται στην πραγματικότητα το δικό τους περιεχόμενο», ανέφερε ο Crowder. Οι τοποθεσίες Web έχουν κακή σχεδίαση που καθιστά τα δεδομένα αποξεστικά πολύ πιο εύκολα. Ο τομέας των μεταχειρισμένων αυτοκινήτων είχε διευθύνσεις URL (Uniform Resource Locators) θα μπορούσε να τροποποιηθεί διαδοχικά για να αποκαλύψει περισσότερα δεδομένα, δήλωσε ο Crowder.

Η μονάδα εξόρυξης δεδομένων θα είναι τυλιγμένη στο προϊόν HumanPresent προς το παρόν, αλλά στις αρχές του επόμενου έτους η Pramana σχεδιάζει να την πουλήσει ξεχωριστά, είπε ο Crowder. Το Pramana προσφέρει το HumanPresent είτε ως συσκευή επί παραγγελία είτε ως διαμόρφωση λογισμικού.

Για την προσφορά SaaS (λογισμικό ως υπηρεσία), η τεχνολογία του Pramana είναι ενσωματωμένη σε μια εφαρμογή Web και οι πληροφορίες της περιόδου σύνδεσης αποστέλλονται πίσω σε Pramana για ανάλυση. Ο Crowder δήλωσε ότι η Pramana κατάφερε να μειώσει σημαντικά το χρόνο καθυστέρησης στην τελευταία της έκδοση. Για τους πελάτες που χρειάζονται μεγαλύτερη ταχύτητα, η συσκευή είναι διαθέσιμη.