Τα γλωσσικά μοντέλα είναι φτιαγμένα για να κατανοούν τέλεια τα αγγλικά, αλλά όχι άλλες γλώσσες – Πώς η ΕΕ θέλει να καλύψει το έδαφος σε σχέση με τις ΗΠΑ

Σε έναν αγώνα δρόμου για να φτιάξουν τα δικά τους εργαλεία τεχνητής νοημοσύνης έχουν μπει οι ευρωπαϊκές χώρες για να διασώσουν τις οικονομίες και τις κουλτούρες τους -αλλά και τις ίδιες τις γλώσσες τους- από την εισβολή των αμερικανικών εργαλείων.

Στόχος είναι οι εφαρμογές να κατανοούν σωστά μια ευρωπαϊκή γλώσσα – όπως τα ισπανικά, τα βουλγαρικά, τα φινλανδικά ή και τα ελληνικά – και όχι «στο περίπου», όπως μια αμερικανική και αγγλόφωνη εφαρμογή σαν το ChatGPT.

Οι εφαρμογές βασίζονται στα μεγάλα γλωσσικά μοντέλα (LLM) που είναι -ή, θεωρητικά, πρέπει να είναι – κομμένα και ραμμένα πάνω σε μια γλώσσα.

Οι ΗΠΑ προηγούνται σε αυτή τη μάχη, έχοντας LLM που αναπτύσσονται από εταιρείες όπως η Microsoft, η Google, η Meta και X. Η ταχύτητα με την οποία οι αμερικανικές εταιρείες δίνουν σε χρήση νέα μοντέλα κάνει τις ευρωπαϊκές εταιρείες τουλάχιστον ανήσυχες για το αν μπορούν να τις ανταγωνιστούν.

Έρευνα του Politico δείχνει, πάντως, ότι πέρυσι 13 ευρωπαϊκές χώρες ανακοίνωσαν ότι έκαναν βήματα για να αναπτύξουν εγχώρια LLM. Τα περισσότερα έχουν κώδικα προσιτό από όλους. Είναι ένας τρόπος να προσελκύσουν εθελοντές προγραμματιστές οι οποίοι μπορούν να προτείνουν αλλαγές και βελτιώσεις.

Αυτό, όμως, που χρειάζονται οι προγραμματιστές για να «εκπαιδεύσουν» τα μοντέλα είναι ένας πολύ μεγάλος όγκος από κείμενα – όσο περισσότερα, τόσο το καλύτερο. Στην Ευρωπαϊκή Ένωση των 24 γλωσσών αυτό πρέπει να γίνει για κάθε γλώσσα χωριστά για να «στηθούν» πάνω στο μοντέλο οι εφαρμογές, όπως ο ψηφιακός βοηθός για το ελληνικό Δημόσιο.

Η ειρωνεία είναι ότι τα ευρωπαϊκά LLM για να είναι πραγματικά ανταγωνιστικά πρέπει να είναι άπταιστα στα αγγλικά, γιατί παραμένουν η κυρίαρχη γλώσσα στην επιστήμη και το Διαδίκτυο.

Πρέπει όμως να μάθουν τα τοπικά μοντέλα τους κανόνες συμπεριφοράς που αλλάζουν από χώρα σε χώρα: δεν θα πρέπει, για παράδειγμα, να μιλούν στον ενικό σε γλώσσες με πληθυντικό ευγενείας. Ακόμη περισσότερο, τα LLM πρέπει να «μάθουν» πολιτιστικούς κανόνες και συνήθειες που επίσης διαφέρουν από τους αμερικανικούς.

Οι Αμερικανοί δεν κάθονται με σταυρωμένα χέρια σε αυτή τη μάχη. Η OpenAI, η εταιρεία που αναπτύσσει μοντέλα με τη στήριξη της Microsoft έχει συνάψει συμφωνίες με ομίλους ενημέρωσης, όπως της Bild και της Le Monde για να χρησιμοποιήσει το υλικό τους για να εκπαιδεύσει τα μοντέλα της.

Ήταν μια απόφαση που κινητοποίησε την Ευρώπη.

Ο Γάλλος υπουργός Οικονομίας Μπρινό Λε Μερ εξέφρασε γλαφυρά σε εκδήλωση στις Κάννες τον περασμένο Φεβρουάριο την αγωνία να αφανιστούν οι γλώσσες κάτω από την επίδραση των αγγλικών: «Ο Μαρκ Τουέιν δεν θα έπρεπε να διαγράψει τον Σταντάλ», είπε και πρόσθεσε ότι «δεν θέλουμε η γλώσσα μας να αποδυναμωθεί από τους αλγόριθμους και τα συστήματα τεχνητής νοημοσύνης».

Πρότεινε ακόμη ένα είδος πανευρωπαϊκής αγοράς για την εκπαίδευση των μοντέλων για να προστατεύσει, κατά κάποιο τρόπο, τις ευρωπαϊκές εταιρείες από τις αμερικανικές και τη βουλιμία τους για δεδομένα. Εν τω μεταξύ η Γαλλία προχώρησε στη σύσταση ενός άτυπου κονσόρτιουμ 12 χωρών για συνεργασία πάνω σε ευρωπαϊκά LLM.

Αρκούν αυτά τα βήματα ή, όπως σημειώνει το Politico, ότι θα επαναληφθεί η ήττα που υπέστη η Ευρώπη με τα κοινωνικά δίκτυα, όπως το Facebook, που είναι αμερικανικές πλατφόρμες; Με την ταχύτητα που κινείται ο κλάδος αλλά και με την βραδύτητα με την οποία η Ευρώπη παίρνει αποφάσεις, η απάντηση μπορεί να μην αργήσει να γίνει γνωστή.

protothema.gr

Ακολουθήστε το HappenedNow.gr στο Google News και μάθετε πρώτοι όλες τις ειδήσεις

Διαβάστε ολες τις ειδήσεις μας στο Facebook Group και μάθετε πρώτοι όλες τις ειδήσεις