Ο απώτερος στόχος είναι να δημιουργηθούν μηχανήματα με γενική τεχνητή νοημοσύνη, που να αντικατοπτρίζουν την ανθρώπινη νοημοσύνη με απόλυτα φυσικό και ολοκληρωμένο τρόπο, κάτι που μέχρι σήμερα δεν έχει καταστεί εφικτό.
«Αν πρόκειται να έχουμε προγράμματα υπολογιστών που είναι πιο έξυπνα και πιο χρήσιμα, τότε θα πρέπει να διαθέτουν την ικανότητα να μαθαίνουν με διαδοχικό τρόπο» δήλωσε ο ερευνητής της DeepMind Τζέημς Κιρκπάτρικ.
Η ικανότητα να θυμούνται παλιές γνώσεις και δεξιότητες, τις οποίες μετά αξιοποιούν στην επίλυση των επόμενων προβλημάτων, είναι κάτι που γίνεται φυσικά στους ανθρώπους, αλλά όχι στις μηχανές μέχρι στιγμής. Οι περισσότεροι υπολογιστές με τεχνητή νοημοσύνη βασίζονται στα λεγόμενα νευρωνικά δίκτυα, που π.χ. μαθαίνουν να παίζουν σκάκι ή πόκερ μέσω ατελείωτων δοκιμών ορθού-λάθους. Όμως, για να μάθει ένα άλλο παιγνίδι αργότερα, ο «έξυπνος» υπολογιστής πρέπει προηγουμένως να σβήσει ό,τι είχε μάθει για τα προηγούμενα παιγνίδια (κάτι που ονομάζεται «καταστροφική λήθη»).
Η νέα μελέτη κάνει ένα σημαντικό βήμα για να πάψουν οι υπολογιστές να ξεχνάνε τα χρήσιμα πράγματα που έμαθαν. Οι ερευνητές εμπνεύσθηκαν από τη νευροεπιστήμη, η οποία δείχνει ότι τα ζώα -και ο άνθρωπος- μαθαίνουν συνεχώς να διατηρούν στον εγκέφαλό τους εκείνες τις νευρωνικές συνδέσεις που αφορούν γνώσεις του παρελθόντος κρίσιμες για την επιβίωσή τους (π.χ. πώς να κρύβονται από τους θηρευτές ή πώς να βρίσκουν τροφή).
Κατά τον ίδιο τρόπο, η νέα μέθοδος μηχανικής μάθησης, προτού προχωρήσει στο επόμενο πρόβλημα, ξεχωρίζει ποιες συνδέσεις του νευρωνικού δικτύου του υπολογιστή είναι οι πιο σημαντικές για ό,τι έχει μάθει έως εκείνη τη στιγμή, προκειμένου αυτές να μην αλλάξουν ή σβησθούν, όταν προστεθούν οι νέες γνώσεις.
Έτσι, η μηχανή μπορεί να επαναχρησιμοποιήσει ό,τι έχει μάθει, όπως έδειξαν τα πειράματα, στα οποία το πρόγραμμα τεχνητής νοημοσύνης κλήθηκε να παίξει διάφορα βιντεοπαιγνίδια. Χάρη στις γνώσεις από το ένα παιγνίδι, η μηχανή μπορούσε να μάθει ταχύτερα να παίζει τα επόμενα παιγνίδια, όπως κάνουν και οι άνθρωποι.
Όμως, προς το παρόν, παραμένει ασαφές αν, χάρη στη νέα μέθοδο, μπορεί να μάθει να παίζει όχι μόνο πιο γρήγορα αλλά και πιο καλά πολλά διαφορετικά παιγνίδια, από ό,τι θα έκανε αν -με την παραδοσιακή μέθοδο- ειδικευόταν σε ένα μόνο παιγνίδι.
«Δείξαμε ότι (το πρόγραμμα) μπορεί να μάθει διαδοχικά να κάνει διαφορετικά πράγματα, αλλά δεν έχουμε δείξει ότι μπορεί να τα κάνει καλύτερα, επειδή τα έχει μάθει διαδοχικά. Συνεπώς υπάρχουν ακόμη περιθώρια βελτίωσης» δήλωσε ο Κιρκπάτρικ. Αναγνώρισε πάντως ότι «απέχουμε ακόμη πραγματικά πολύ από μία γενική τεχνητή νοημοσύνη και είναι πολλές οι επιστημονικές προκλήσεις που πρέπει να ξεπερασθούν».