Μεγάλα μοντέλα τεχνητής νοημοσύνης μεταμορφώνουν τις ζωές μας και την αγορά εργασίας
Έρχονται και μαζί με υποσχέσεις φέρνουν και κινδύνους.
Εικόνα: Pixabay
Από τον Νοέμβριο του 2022, όταν η OpenAI, η εταιρεία που κατασκεύασε το ChatGPT, άνοιξε για πρώτη φορά το chatbot στο κοινό, η κουβέντα περιστρεφόταν μονάχα γύρω από το γεγονός.
Ένας ιδρυτής κάποιας εταιρείας τεχνολογίας στο Λονδίνο έστειλε μάλιστα μήνυμα στον αρχικό συντάκτη αυτού του κειμένου (δηλαδή σε συντάκτη του Economist) προκειμένου να του πει πως αυτό το είδος τεχνητής νοημοσύνης είναι ουσιαστικά το μόνο που σκέπτεται τις τελευταίες μέρες. Ο ίδιος είπε ότι βρίσκεται σε διαδικασία επανασχεδιασμού της εταιρείας του, η οποία εκτιμάται σε πολλές εκατοντάδες εκατομμύρια δολάρια. Και δεν είναι ο μόνος.
Το ChatGPT ενσωματώνει περισσότερη γνώση από όση έχει γνωρίσει οποιοσδήποτε άνθρωπος. Μπορεί να συζητήσει για εξορύξεις στην Παπούα Νέα Γουινέα ή για την TSMC, μια ταϊβανέζικη εταιρεία που βρίσκεται στο γεωπολιτικό στόχαστρο.
Το GPT-4, το τεχνητό δίκτυο που τροφοδοτεί το ChatGPT έχει ιδιαίτερο ενδιαφέρον. Μπορεί να δημιουργήσει τραγούδια, ποιήματα και δοκίμια. Άλλα μοντέλα «τεχνητής νοημοσύνης» μπορούν να παράγουν ψηφιακές φωτογραφίες, σχέδια και κινούμενα σχέδια.
Όπως όλα δείχνουν, τα μοντέλα παραγωγής τεχνητής νοημοσύνης αναπτύσσονται πολύ γρήγορα. Το GPT-4 είναι ένας τύπος γενετικής τεχνητής νοημοσύνης που ονομάζεται μοντέλο μεγάλων γλωσσών (LLM).
Τεχνολογικοί “κολοσσοί” όπως η Alphabet, η Amazon και η Nvidia έχουν εκπαιδεύσει τα δικά τους LLM και τους έχουν δώσει ονόματα όπως PaLM, Megatron, Titan και Chinchilla.
Μεγαλώνει το δέλεαρ
Ο ιδρυτής της τεχνολογικής εταιρείας στο Λονδίνο- για τον οποίο έγινε λόγος στην αρχή του κειμένου- λέει ότι είναι «ανήσυχος από την υπαρξιακή απειλή» που θέτει η τεχνητή νοημοσύνη, ακόμη και όταν την επιδιώκει, και «μιλά με [άλλους] ιδρυτές γι’ αυτό καθημερινά». Κυβερνήσεις στην Αμερική, την Ευρώπη και την Κίνα άρχισαν όλες να εξετάζουν νέους κανονισμούς.
Υπάρχουν και εκείνες οι φωνές οι οποίες ζητούν να σταματήσει η ανάπτυξη της τεχνητής νοημοσύνης. Και αυτό γιατί φοβούνται ότι το λογισμικό ενδέχεται να ξεφύγει από τον έλεγχο και να καταστρέψει μέχρι και την ανθρώπινη κοινωνία. Για να δείτε όμως πόσο θα πρέπει τελικά να ανησυχείτε ή να ενθουσιάζεστε, θα πρέπει πρώτα να καταλάβετε από πού προήλθε αυτή η τεχνολογία, πώς λειτουργεί και ποια είναι τα όρια για την ανάπτυξή της.
Οι ιδιαίτερα αυξημένες δυνατότητες του λογισμικού AI ξεκίνησαν στις αρχές της δεκαετίας του 2010, όταν έγινε γνωστή μια τεχνική λογισμικού με το όνομα «deep learning».
Σειρά παραγόντων οδήγησε σε δραματική βελτίωση των υπολογιστών στο να αναγνωρίζουν εικόνες, να επεξεργάζονται ήχο και να παίζουν παιχνίδια. Μέχρι τα τέλη της δεκαετίας του 2010 οι υπολογιστές μπορούσαν να κάνουν πολλές από αυτές τις εργασίες καλύτερα από οποιονδήποτε άνθρωπο.
Ο Lee Sedol, ένας από τους καλύτερους παίκτες του Go, ενός αρχαίου κινεζικού επιτραπέζιου παιχνιδιού, αποσύρθηκε από το παιχνίδι αφού το λογισμικό AlphaGo που βασίζεται σε νευρωνικά δίκτυα της Alphabet τον συνέτριψε το 2016. «Ακόμα κι αν γίνω ο νούμερο ένα», είπε, «υπάρχει μια οντότητα που δε μπορεί να νικηθεί».
Το ChatGPT επιτρέπει τώρα στο κοινό που χρησιμοποιεί το Διαδίκτυο να βιώσει ένα είδος πνευματικού “ιλίγγου” που προκαλείται από λογισμικό που έχει βελτιωθεί ξαφνικά σε σημείο που μπορεί να εκτελεί εργασίες που ήταν αποκλειστικά στο πεδίο της ανθρώπινης νοημοσύνης.
Ζητήστε από το ChatGPT να ολοκληρώσει την πρόταση: “Η υπόσχεση των μεγάλων μοντέλων γλώσσας είναι…” και θα λάβετε μια άμεση απάντηση.
Πώς λειτουργεί;
Πρώτον, το ερώτημα μετατρέπεται σε ένα αντιπροσωπευτικό σύνολο αριθμών. Το GPT-3, το οποίο τροφοδοτούσε μια παλαιότερη έκδοση του ChatGPT, το κάνει αυτό χωρίζοντας το κείμενο σε κομμάτια χαρακτήρων, που ονομάζονται tokens, τα οποία συνήθως εμφανίζονται μαζί.
Το GPT-3 είναι σε θέση να επεξεργάζεται έως και 2.048 διακριτικά τη φορά, που είναι περίπου όσο ένα εκτενές άρθρο στο The Economist. Το GPT-4, αντίθετα, μπορεί να χειριστεί εισόδους έως και 32.000 tokens—δηλαδή μια νουβέλα.
Όσο περισσότερο κείμενο μπορεί να λάβει το μοντέλο, τόσο περισσότερο περιεχόμενο μπορεί να δει και τόσο καλύτερες θα είναι οι απαντήσεις του.
Η επεξεργασία των δεδομένων
Η πρόσφατη επιτυχία των LLM στη δημιουργία πειστικού κειμένου, καθώς και οι αναδυόμενες ικανότητές τους, οφείλονται σε τρία πράγματα: τις ποσότητες δεδομένων, τους αλγόριθμους και την υπολογιστική ισχύ. Οι λεπτομέρειες της κατασκευής και της λειτουργίας του GPT-4 δεν είναι ακόμη δημόσιες, αλλά αυτές του GPT-3 είναι.
Μια σημαντική συσκευή
Με τη δύναμη των LLM σε πολλά χέρια πολλά μπορεί να βελτιωθούν από την ιατρική μέχρι τη νομοθεσία.
Βεβαίως, δεν πρέπει να ξεχνάμε και ότι τα LLM είναι ήδη απίστευτα ισχυρά και έχουν βελτιωθεί τόσο γρήγορα που πολλοί από αυτούς που εργάζονται σε αυτά έχουν τρομάξει.
Οι δυνατότητες των μεγαλύτερων μοντέλων έχουν ξεπεράσει την κατανόηση και τον έλεγχο των δημιουργών τους. Αυτό δημιουργεί κινδύνους. Κάθε είδους.
Πηγή: Economist