promotional banner

Οι υπολογιστές εκπαιδεύονται να κατανοούν τη γλώσσα μας


Λογισμικό μπορεί να αποκωδικοποιήσει τα «αληθινά νοήματα» όσων γράφουμε

Η διαφορά ανάμεσα στο να λες αυτό που εννοείς και να εννοείς αυτό που λες είναι αρκετά σαφής, για τους περισσότερους ανθρώπους. Αντιθέτως, όμως, όταν η διάκριση πρέπει να γίνει από ηλεκτρονικό υπολογιστή τα πράγματα είναι πολύ πιο δύσκολα.

Το να καταφέρει ένα κομπιούτερ να αξιολογήσει τι εννοεί κάποιος άνθρωπος, παραδείγματος χάριν, θα αποδειχθεί εξαιρετικά ωφέλιμο επίτευγμα για τις εταιρείες που προσπαθούν να αναγνωρίσουν τους δυσαρεστημένους πελάτες, όπως εξάλλου και τις υπηρεσίες πληροφοριών που προσπαθούν να εντοπίσουν ποιοι από τους χρήστες του Ιντερνετ που αναρτούν σχόλια με απειλές είναι πραγματικά επικίνδυνοι και ποιοι όχι.

Πολύ συχνά, οι ηλεκτρονικοί υπολογιστές αδυνατούν να κατανοήσουν το πραγματικό νόημα των λέξεων, διότι αυτό εξαρτάται από το πλαίσιο στο οποίο χρησιμοποιείται κάθε λέξη. Παραδείγματος χάριν, η λέξη «εξόντωση» έχει αρνητικό νόημα όπως και η λέξη «βακτήρια».

Ωστόσο, η φράση «εξόντωση βακτηρίων» είναι θετική.

Μία προσπάθεια να «εκπαιδευτούν» οι ηλεκτρονικοί στην αξιολόγηση της συναισθηματικής αξίας των λέξεων (και άρα του νοήματός τους) γίνεται από τον δόκτορα Στίβεν Πούλμαν του Πανεπιστημίου της Οξφόρδης και τον βοηθό του Κάρο Μοϊλάνεν.

Οι δύο ερευνητές χρησιμοποιούν λογισμικό ανάλυσης συναισθημάτων για να αξιολογήσουν το νόημα ενός κειμένου. Ετσι, ανέπτυξαν ένα σύστημα κατάταξης που αναλύει τη γραμματική δομή ενός σύντομου κειμένου και μπορεί να καταλήξει στη συναισθηματική του αξία. Για να τα καταφέρουν οι επιστήμονες ανατρέχουν σε ένα λεξικό συναισθημάτων όπου περιλαμβάνονται περισσότερες από 57 χιλιάδες λέξεις και η συναισθηματική σημασία που έχει κάθε μία από αυτές. Η συναισθηματική αξιολόγηση κάθε λέξης μπορεί να είναι θετική, αρνητική ή ουδέτερη. Λέξεις όπως «ποτέ», «απέτυχε» και «πρόλαβε» θεωρούνται «μεταβλητές» επειδή μπορούν να μεταβάλλουν το νόημα της λέξης που έπεται.

Η ανάλυση στη συνέχεια κατακερματίζεται σε κομμάτια που λαμβάνουν υπόψη όλο και πιο μεγάλα γραμματικά τμήματα. Καθώς περνάει κάθε ενότητα, η αξιολόγηση μεταβάλλεται. Οι κανόνες της γραμματικής καθορίζουν την επίδραση που έχει κάθε τμήμα κειμένου πάνω στο άλλο. Ο πιο απλός κανόνας είναι ότι θετικά και αρνητικά συναισθήματα τελικά κυριαρχούν επί των πιο ουδετέρων. Πιο πολύπλοκοι συντακτικοί κανόνες τελικά καθορίζουν το νόημα στις περιπτώσεις όπου η σημασία των λέξεων είναι αντιφατική, όπως παραδείγματος χάριν στη φράση «η κόλαση των διακοπών» και η «γραμμή βοήθεια για την κακοποίηση». Μπορεί το νόημα τέτοιων φράσεων να είναι ξεκάθαρο σε εμάς τους ανθρώπους, αλλά είναι ακατανόητο στους ηλεκτρονικούς υπολογιστές.

Συναισθηματική αξία

Αναλύοντας τη συναισθηματική βαθμολογία κάθε λέξης, το νέο λογισμικό μπορεί να αξιολογήσει τη συναισθηματική αξία διάφορων εννοιών που αναφέρονται σε ένα κείμενο. Παραδείγματος χάριν, η φράση «η ισχυρότερη οικονομία της περιοχής εξακολουθεί να μαστίζεται από την ύφεση» αναλύεται ως εξής: «ισχυρότερη» (θετική, ουδέτερη ή αρνητική) οικονομία (ουδέτερη ή θετική) καταβυθίζεται (αρνητική) και ύφεση (αρνητική).

Στη συνέχεια, το λογισμικό αναλύει τη δομή της πρότασης ξεκινώντας από τη λέξη οικονομία και συνεχίζοντας στο ισχυρότερη οικονομία, η ισχυρότερη οικονομία της περιοχής και ούτω καθεξής. Σε κάθε βήμα, το λογισμικό υπολογίζει τη μεταβαλλόμενη συναισθηματική αξία της πρότασης. Το ίδιο επαναλαμβάνεται για το δεύτερο τμήμα της πρότασης. Αντί να προσθέσει απλά τα θετικά και τα αρνητικά τμήματα που περιλαμβάνονται σε μία πρόταση, το λογισμικό αποδίδει στο κάθε κομμάτι μια συγκεκριμένη βαθμολογία. Τα βραχύτερα τμήματα του κειμένου, όπως παραδείγματος χάριν η λέξη περιοχή, έχουν μικρότερη βαθμολογία από ό, τι έχουν τα μακρύτερα τμήματα, όπως το «η ισχυρότερη οικονομία της περιοχής». Οταν το λογισμικό ανασυνθέτει την αρχική πρόταση μπορεί πια να καταλήξει στο ορθό συμπέρασμα, ότι δηλαδή το νόημά της είναι αρνητικό όσον αφορά τον όρο «οικονομία».

Οι ερευνητές επισημαίνουν ότι αυτή η προσέγγιση είναι πολύ καλύτερη από προηγούμενες οι οποίες μπορούν να αξιολογήσουν από κάποιες λέξεις την ψυχική διάθεση του καταναλωτή, αλλά δεν μπορούν να συνδέσουν πολύπλοκες προτάσεις. Μπορεί, παραδείγματος χάριν, ένας καταναλωτής να λατρεύει το σπορ μοντέλο κάποιας μάρκας αυτοκινήτου, αλλά όχι και το σύστημα ήχου του.

Αναζητώντας τρομοκράτες

Οι εταιρείες αναζητούν ηλεκτρονικούς τρόπους που θα τους επιτρέψουν να κατανοήσουν καλύτερα την πελατεία τους εδώ και καιρό. Τώρα όμως και οι υπηρεσίες πληροφοριών ενδιαφέρονται για την απόκτηση λογισμικών ανάλυσης συναισθήματος. Κάποιες υπηρεσίες ήδη χρησιμοποιούν εργαλεία που δημιούργησε το εργαστήριο τεχνητής νοημοσύνης του Πανεπιστημίου της Αριζόνας για να χαρτογραφήσει τα έντονα και βίαια συναισθήματα που συχνά διαφαίνονται μέσα από αναρτήσεις στο Ιντερνετ. Με αυτήν την τεχνολογία μπορούν να εντοπίσουν τους επίδοξους τρομοκράτες. Ο Χσιντσούν Τσεν, διευθυντής του εργαστηρίου, υποστηρίζει ότι αναλύοντας οκτώ εκατομμύρια αναρτήσεις, το λογισμικό του μπορεί να διακρίνει μερικές εκατοντάδες σχόλια που έχουν γίνει από είκοσι έως τριάντα άτομα, τα οποία χρήζουν παρακολούθησης. Ωστόσο, το λογισμικό μπορεί μόνο να συμπληρώσει την ανθρώπινη νοημοσύνη, και τούτο επειδή πολλοί άνθρωποι απλά λένε πράγματα τα οποία δεν εννοούν.