Κατάταξη αποτελεσμάτων στις μηχανές αναζήτησης. Μια συγκριτική μεθοδολογική προσέγγιση μεταξύ της Google και της Bing
Ranking results in search engines. A comparative methodological perspective between Google & Bing
Πτυχιακή εργασία
Author
Νταραράς, Βασίλειος Παναγίωτης
Ντίμο, Γεώργιος
Date
2023-07-10Advisor
Kouis, DimitrisKeywords
Μηχανές αναζήτησης ; Google ; Bing ; Βελτιστοποίηση μηχανών αναζήτησης ; SEO ; Κατάταξη ιστοσελίδων ; Google trends ; Μετρικές ιστού ; Βελτιστοποίηση ιστοσελίδωνAbstract
Σκοπός και Πλαίσιο Μελέτης: Η σύγχρονη εποχή, η οποία εύστοχα χαρακτηρίζεται ως η εποχή της “πληροφορίας” λόγω του τεράστιου όγκου δεδομένων που παράγεται διαρκώς στον παγκόσμιο ιστό. Για την διαχείριση της τεράστιας ποσότητας δεδομένων και πληροφοριών επιστρατεύονται οι μηχανές αναζήτησης ως μέσα ανάκτησης, διάδοσης και οπτικοποίησης της πληροφορίας καλύπτοντας τις ανάγκες των χρηστών σε ποσότητα και ποιότητα. Η ποσότητα των αποτελεσμάτων εκφράζεται με τον αριθμό που ανακτάται ανά ερώτημα που υποβάλλει ο εκάστοτε χρήστης, ενώ η ποιότητα παρουσιάζεται μέσω της κατάταξης των αποτελεσμάτων σε μία μηχανή αναζήτησης. Η παρούσα μελέτη έχει σκοπό να συγκρίνει τα αποτελέσματα δύο μηχανών αναζήτησης της Google και της Bing τόσο ως προς την πιθανότητα αλληλοκάλυψης και το βαθμό ομοιότητας τους, όσο και ως προς την απόδοση αυτών των αποτελεσμάτων ως ιστοσελίδες. Η συγκεκριμένη απόδοση λαμβάνεται υπόψη μέσω τριών αξόνων αξιολόγησης, το βαθμό επιμέλειας των μεταδεδομένων των ιστοσελίδων, την ταχύτητα και την ασφάλεια.
Σχεδιασμός Έρευνας/Μεθοδολογία: Για την επίτευξη του σκοπού μελέτης αναπτύχθηκε σχετική μεθοδολογία, η οποία υποστήριξε συνολικά την ερευνητική μας προσπάθεια. Πιο συγκεκριμένα, αναζητούμε τους 10 δημοφιλέστερους όρους του 2021 μέσω της εφαρμογής Google Trends. Στη συνέχεια, αναζητούμε τους 10 όρους στις μηχανές αναζήτησης Google και Bing και συγκεντρώνουμε τα 10 πρώτα αποτελέσματα για κάθε έναν από τους 10 όρους. Ύστερα, διαλέγουμε τα 5 πρώτα αποτελέσματα-URLs του κάθε όρου και από τις δύο μηχανές αναζήτησης. Στην επόμενη φάση, συγκεντρώνουμε τα εναπομείναντα αποτελέσματα, τα οποία αναλύουμε μέσω του εργαλείου Checkbot. Με βάση τα αποτελέσματα του Checkbot, δημιουργούμε δύο φύλλα Excel για τα αποτελέσματα καθεμίας μηχανής αναζήτησης. Τα φύλλα αυτά, έχουν 3 στήλες (Search Term, URL, Website Score), στις οποίες καταχωρούμε τους όρους, τα 5 URLs του κάθε όρου και η βαθμολογία που συγκεντρώνει στο Checkbot. Συνολικά χρησιμοποιήσαμε περισσότερες από 34 μετρικές απόδοσης. Ένα βήμα παρακάτω αναπτύχθηκαν μοντέλα πρόβλεψης μέσω γραμμικών παλινδρομήσεων κατά ζεύγη για την προτεραιοποίηση της βελτιστοποίησης ανά μετρική.
Ενδεικτικά Αποτελέσματα: Η ερευνητική μας προσπάθεια παρουσίασε μία σειρά από αποτελέσματα-μετρήσεις τα οποία αποτυπώνουν τη δυναμική των δύο μηχανών αναζήτησης Google και Bing. Ειδικότερα, ενδιαφέρον στατιστικό δεδομένο αποτελεί το 5% ποσοστό αλληλοκάλυψης (Overlapping). Πιο συγκεκριμένα, μόλις 5% των συνολικών αποτελεσμάτων των Google και Bing ανήλθαν σε κοινή θέση στην κατάταξη αποτελεσμάτων που όρισαν οι μηχανές. Επιπλέον, συγκεκριμένες μετρικές εμφανίζουν την ανάλογη μεγαλύτερη απήχηση βελτιστοποίησης συγκριτικά με άλλες και για τους τρεις άξονες αξιολόγησης.
Πρωτοτυπία/ Συνεισφορά: Η εν λόγω έρευνα αποτελεί μια από τις πιο πρόσφατες προσπάθειες σύγκρισης μεταξύ Google και Bing. Για την επίτευξη των στόχων της έρευνας, όπως αναφέρεται παραπάνω συγκροτήθηκε μεθοδολογική προσέγγιση, η οποία δημιουργήθηκε εξ ολοκλήρου χωρίς την ύπαρξη προγενέστερων παρόμοιων ολοκληρωμένων ερευνητικών προσεγγίσεων. Η μεθοδολογία μας οδήγησε στην δημιουργία βημάτων ανάλυσης και ερμηνείας της απόδοσης των ιστοσελίδων. Με άλλα λόγια, μια απλή και συνεχόμενη διαδικασία βελτίωσης των μετρικών των ιστοσελίδων, ώστε να επιτύχουν καλύτερη θέση κατάταξης και παράλληλα καλύτερη εμπειρία χρήστη στο περιβάλλον της ιστοσελίδας και στις δύο μηχανές αναζήτησης.
Abstract
Purpose and Context of the Study: The modern age, is aptly described as the "information age" due to the huge amount of data that is constantly being generated on the web. To manage the huge amount of data and information, search engines are being enlisted as a means of retrieving, disseminating and visualizing information to cover the needs of users in terms of quantity and quality. The quantity of results is expressed in terms of the number of retrieved documents per query submitted by each user, while the quality is represented by the ranking of results in a search engine. This study aims to compare the results of two search engines Google and Bing both in terms of the probability of overlap and their degree of similarity, and in terms of the performance of these results as web pages. This performance is taken into account through three evaluation aspects, the degree of metadata curation of the web pages, speed and security.
Research Design/Methodology: To achieve the study purpose, a relevant methodology was developed, that supported our overall research effort. More specifically, we searched for the 10 most popular terms of 2021 through the Google Trends web application. We then search for the 10 terms on Google and Bing search engines and compile the top 10 results for each of the 10 terms. Then, we pick the top 5 results-URLs of each term, that is the first five websites from both search engines to evaluate the performance of these selected websites. The selected websites have been analyzed through the CheckBot crawler web-based tool. According to the Checkbot results, we create two Excel sheets for the results of each search engine. These sheets, have 3 columns (Search Term, URL, Website Score), in which we enter the terms, the 5 URLs of each term and the score that it accumulates in Checkbot. Totally, we used more than 34 performance metrics of metadata, speed and security effectiveness. One step further, predictive models were developed using stepwise linear regressions to prioritize optimization by metric.
Indicative Results: Our research effort presented a series of results-measurements that encapsulate the dynamics of the two search engines Google and Bing. In particular, an interesting statistic is the 5% overlap rate. It is also worth noting that only 5% of the total results of Google and Bing were ranked together in the results ranking defined by the engines. Furthermore, specific metrics showed a proportionately higher optimization impact compared to others for all three evaluation axes.
Originality/Contribution: This research is one of the most recent attempts to compare Google and Bing. In order to achieve the research objectives, as mentioned above, a methodological approach was put together, which was created entirely without the existence of previous similar integrated research approaches. The methodology led us to create steps for analyzing and interpreting the performance of the websites. In other words, a simple and continuous process of improving the metrics of the websites to achieve better ranking position, and at the same time, greater user experience in the website's interface in both search engines.