Τι είναι ένας ιστότοπος Scraper; - Η απάντηση Semalt

Ένας ιστότοπος scraper είναι ο ιστότοπος που αντιγράφει το περιεχόμενο από άλλα ιστολόγια και ιστότοπους χρησιμοποιώντας μερικές τεχνικές απόξεσης ιστού. Αυτό το περιεχόμενο αντικατοπτρίζεται με σκοπό τη δημιουργία εσόδων, είτε μέσω διαφήμισης είτε με την πώληση των δεδομένων χρήστη. Διάφοροι ιστότοποι scraper διαφέρουν ανάλογα με τις μορφές και τους τύπους, που κυμαίνονται από ιστότοπους περιεχομένου ανεπιθύμητου περιεχομένου έως τη συγκέντρωση τιμών και τα καταστήματα αγορών στο Διαδίκτυο.
Διαφορετικές μηχανές αναζήτησης, ειδικά το Google, μπορούν να θεωρηθούν ως ιστότοποι ξύστρου. Συλλέγουν περιεχόμενο από πολλούς ιστότοπους, το αποθηκεύουν σε βάση δεδομένων, ευρετήριο και παρουσιάζουν το εξαγόμενο ή αποκομμένο περιεχόμενο στους χρήστες στο Διαδίκτυο. Στην πραγματικότητα, το μεγαλύτερο μέρος του περιεχομένου που αποκόπτεται ή εξάγεται από τις μηχανές αναζήτησης έχει πνευματικά δικαιώματα.
Κατασκευασμένο για διαφήμιση:
Μερικοί από τους ιστότοπους scraper δημιουργούνται για να κερδίζουν χρήματα στο διαδίκτυο χρησιμοποιώντας διαφορετικά διαφημιστικά προγράμματα. Σε τέτοιες περιπτώσεις, ονομάζονται ιστότοποι Made for AdSense ή MFA. Ο υποτιμητικός όρος αναφέρεται στους ιστότοπους που δεν έχουν καμία αξία εξαργύρωσης που αναμένεται να προσελκύσουν, να δελεάσουν και να προσελκύσουν τους επισκέπτες στους καθορισμένους ιστότοπους για να λάβουν κλικ σε διαφημίσεις. Οι ιστότοποι και τα ιστολόγια Made for AdSense θεωρούνται τα ισχυρά ανεπιθύμητα μηνύματα της μηχανής αναζήτησης. Αραιώνουν τα αποτελέσματα αναζήτησης με τα λιγότερο ικανοποιητικά αποτελέσματα. Ορισμένοι ιστότοποι scraper είναι γνωστό ότι συνδέονται με άλλους ιστότοπους και στοχεύουν στη βελτίωση της κατάταξης της μηχανής αναζήτησης μέσω των ιδιωτικών δικτύων blog. Προτού η Google ενημερώσει τους αλγορίθμους αναζήτησης, διαφορετικοί τύποι ιστότοπων ξύστρου ήταν διάσημοι μεταξύ των ειδικών SEO και των εμπόρων μαύρου καπέλου. Χρησιμοποίησαν αυτές τις πληροφορίες για spamdexing και πραγματοποίησαν μια ποικιλία λειτουργιών.

Νομιμότητα:
Οι ιστότοποι scraper είναι γνωστό ότι παραβιάζουν τους νόμους περί πνευματικών δικαιωμάτων. Ακόμη και η λήψη περιεχομένου από ιστότοπους ανοιχτού κώδικα αποτελεί παραβίαση πνευματικών δικαιωμάτων, εάν γίνεται με τρόπο που δεν σέβεται καμία άδεια. Για παράδειγμα, οι άδειες χρήσης δωρεάν τεκμηρίωσης GNU και Creative Commons ShareAlike χρησιμοποιήθηκαν στη Wikipedia και απαιτούσαν από τον εκδότη εκ νέου της Wikipedia να ενημερώσει τους αναγνώστες ότι το περιεχόμενο αντιγράφηκε από την εγκυκλοπαίδεια.
Τεχνικές:
Οι τεχνικές ή οι μέθοδοι με τις οποίες στοχεύονται οι ιστοσελίδες scraper διαφέρουν από τη μία πηγή στην άλλη. Για παράδειγμα, ιστότοποι με μεγάλο αριθμό δεδομένων ή περιεχομένου, όπως ηλεκτρονικών ειδών ευρείας κατανάλωσης, αεροπορικών εταιρειών και πολυκαταστημάτων, μπορούν να στοχεύονται συνήθως από τους ανταγωνιστές. Οι ανταγωνιστές τους θέλουν να μείνουν ενημερωμένοι για τις τρέχουσες τιμές και τις αγοραίες αξίες μιας μάρκας. Ένας άλλος τύπος ξύστρα τραβά αποσπάσματα και το κείμενο από ιστότοπους που κατατάσσονται υψηλά για συγκεκριμένες λέξεις-κλειδιά. Τείνουν να βελτιώσουν την κατάταξή τους στη σελίδα αποτελεσμάτων της μηχανής αναζήτησης (SERP) και το piggyback στις τάξεις της αρχικής ιστοσελίδας. Οι τροφοδοσίες RSS είναι επίσης ευάλωτες στις ξύστρες. Οι ξύστρες συσχετίζονται συνήθως με τα σύνολα συνδέσμων και γίνονται αντιληπτά όταν ένας ιστότοπος ξύστρα συνδέεται ξανά και ξανά στον ίδιο ιστότοπο.
Παραβίαση τομέα:
Οι προγραμματιστές που είχαν δημιουργήσει ιστότοπους scraper ενδέχεται να αγοράσουν τους τομείς που έχουν λήξει για να τους επαναχρησιμοποιήσουν για σκοπούς SEO. Αυτή η πρακτική επιτρέπει στους ειδικούς SEO να χρησιμοποιούν όλους τους πίσω συνδέσμους αυτού του ονόματος τομέα. Μερικοί από τους spammers προσπαθούν να ταιριάξουν με τα θέματα των ιστότοπων που έχουν λήξει ή / και να αντιγράψουν ολόκληρο το περιεχόμενο από το Αρχείο Διαδικτύου του, διατηρώντας την αυθεντικότητα και την προβολή αυτού του ιστότοπου. Οι υπηρεσίες φιλοξενίας συχνά παρέχουν τη δυνατότητα εύρεσης των ονομάτων ενός domain που έχει λήξει και οι hackers ή spammers χρησιμοποιούν αυτές τις πληροφορίες για να αναπτύξουν τους δικούς τους ιστότοπους.