Ο αλγόριθμος LocalRank παρουσιάζεται με λεπτομέρειες σε αυτό το άρθρο.
Ήδη ο LocalRank αλγόριθμος περιγράφηκε σε προηγούμενο άρθρο, μαζί με γενικότερες οδηγίες πάνω σε προώθηση ιστοσελίδων, σε κατασκευή ιστοσελίδων, σε προβολή ιστοσελίδων καθώς και σε διαφήμιση στο Internet. Επίσης σε προηγούμενο άρθρο παρουσιάστηκαν πληροφορίες σχετικά με τον αλγοριθμο pagerank. Ο pagerank αλγοριθμος είναι η βάση όλων των υπολογισμών της google. …
1. Κατά τον υπολογισμό του LocalScore για κάθε σελίδα, ο αλγόριθμος LocalRank επιλέγει αυτές τις σελίδες από το σύνολο των Ν που έχουν εισερχόμενους συνδέσμους προς τη σελίδα. Ας ονομάσουμε Μ το πλήθος των εισερχομένων συνδέσμων. Την ίδια στιγμή, όλες οι υπόλοιπες σελίδες από τον ίδιο server (η αναγνώριση γίνεται με βάση τη διεύθυνση ip) ή οι σελίδες που έχουν mirrors αποκλείονται από το σύνολο των Μ.
2. Το σύνολο Μ διαιρείται σε υποσύνολα Li. Αυτά τα υποσύνολα περιέχουν σελίδες ομαδοποιημένες κατά τα ακόλουθα κριτήρια:
– Ανήκουν σε έναν host, ή σε παρόμοιους hosts. Οι σελίδες που έχουν τρεις ίδιες octets στην IP addresses θα τοποθετηθούν στον ίδιο host. Αυτό σημαίνει οτι οι σελίδες των οποίων οι IP addresses ανήκουν στην περιοχή από xxx.xxx.xxx.0 έως xxx.xxx.xxx.255 θα θεωρηθεί οτι ανήκουν στην ίδια ομάδα.
– Σελίδες που έχουν το ίδιο ή παρόμοιο περιεχόμενο (mirrors)
– Σελίδες από το ίδιο site (domain).
3. Κάθε σελίδα σε Li κάθε υποσύνολο έχει ήδη μια τιμή OldScore. Μια σελίδα με το μέγιστο OldScore λαμβάνεται από κάθε υποσύνολο, και οι υπόλοιπες εξαιρούνται από την ανάλυση. Επομένως λαμβάνουμε κάποιο υποσύνολο από Κ σελίδες που αναφέρονται στην υπο εξέταση από τον αλγόριθμο LocalRank σελίδα.
4. Οι Κ σελίδες σε ένα υποσύνολο ταξινομούνται κατά την παράμετρο OldScore. Στη συνέχεια μόνο οι πρώτες k σελίδες παραμένουν στο υποσύνολο Κ (το k είναι μια προεπιλεγμένη παράμετρος). Οι υπόλοιπες σελίδες εξαιρούνται από την ανάλυση
5. Σε αυτό το βήμα γίνεται και ο υπολογισμός του LocalScore. Οι παράμετροι OldScore συνδυάζονται μεταξύ τους για το σύνολο των k σελίδων.
Εδώ χρησιμοποιείται μια παράμετρος m η οποία έχει τιμή από 1 μέχρι 3. Δυστυχώς το google δεν δίνει περισσότερες πληροφορίες για αυτή την παράμετρο στον αλγόριθμο LocalRank και δεν την περιγράφει με λεπτομέρειες.
Αφού υπολογιστεί το LocalScore για κάθε σελίδα από το σύνολο Ν, τη συνέχεια υπολογίζονται οι τιμές του NewScore για τις σελίδες και επαναταξινομούνται σύμφωνα με νέα κριτήρια. Ο επόμενος τύπος χρησιμοποιείται από τον αλγόριθμο LocalRank για τον υπολογισμό του NewScore:
NewScore(i)= (a+LocalScore(i)/MaxLS)*(b+OldScore(i)/MaxOS)
i είναι η σελίδα της οποίας υπολογίζουμε το νέο NewScore.
a και b είναι αριθμητικές σταθερές και πάλι η google δεν δίνει περισσότερες πληροφορίες για αυτές τις παραμέτρους).
MaxLS είναι η μέγιστη τιμή του LocalScore από όσες υπολογίστηκαν.
MaxOS είναι η μέγιστη τιμή από τις τιμές των OldScore.
αλγόριθμος LocalRank
Στη συνέχεια ακολουθούν κάποιες διευκρινήσεις και κάποιες λεπτομέρειες για την παραπάνω διαδικασία που χρησιμοποιεί ο αλγόριθμος LocalRank.
Στο πρώτο βήμα του αλγόριθμου LocalRank οι σελίδες επιλέγονται με βάση το κριτήριο του κατα πόσο είναι σχετικές με το ερώτημα αναζήτησης. Εδώ χρησιμοποιούνται αλγόριθμοι που λαμβάνουν υπόψη το σχετικό κείμενο των συνδέσμων για να προχωρήσουν στη σχετική επιλογή και στη σχετική ταξινόμηση. Για παράδειγμα, η συνάφεια και η συνολική δημοτικότητα των συνδέσμων χρησιμοποιούνται σε μεγάλη έκταση. Τώρα πλέον έχουμε ένα σύνολο από τις τιμές OldScore. Το OldScore είναι η ταξινόμηση κάθε σελίδας βασισμένη στη συνάφεια καθώς και στη σχετική δημοτικότητα των συνδέσμων και άλλων παραγόντων αξιολόγησης.
Στο δεύτερο βήμα του αλγόριθμου LocalRank επιλέγονται οι σελίδες που έχουν εισερχόμενους συνδέσμους προς την υπο εξέταση σελίδα, δηλαδή καθεμία από τις σελίδες που επιλέχθηκε στο προηγούμενο βήμα. Το τελικό σύνολο δημιουργείται από την αφαίρεση των mirror και άλλων ιστοσελίδων στα βήματα δυο, τρια και τέσσερα. Επομένως καταλήγουμε σε ένα σύνολο πρωτότυπων και μοναδικών ιστοσελίδων που όλες μοιράζονται ένα κοινό θέμα με τη σελίδα την οποία αναλύουμε. Όταν αναλύσουμε τους εισερχομένους συνδέσμους από σελίδες αυτού του συνόλου (και αγνοήσουμε όλες τις υπόλοιπες σελίδες που υπάρχουν στο internet). τότε θα λάβουμε την παράμετρο αξιολόγησης δημοτικότητας του συνδέσμου με βάση την τοπική ή τη θεματική κατηγοριοποίηση.
Οι τιμές LocalScore υπολογίζονται στο βήμα πέντε. Το LocalScore είναι η βαθμολόγηση μιας σελίδας από ένα σύνολο σελίδων που σχετίζονται με ένα συγκεκριμένο θέμα. Στο τελικό στάδιο του αλγόριθμου LocalRank, οι σελίδες αξιολογούνται και βαθμολογούνται χρησιμοποιώντας ένα συνδυασμό του LocalScore και του OldScore.
Πηγή: http://www.infopolis.gr/algorithmos-localrank/