Τεχνολογία

«Είχαν συνηθίσει να τρώνε με χρυσά κουτάλια» – Η κινεζική Deepseek «ξεβολεύει» τις αμερικανικές εταιρίες AI

Καθηγητής Πληροφορικής εξηγεί γιατί το νέο AI μοντέλο έχει προκαλέσει τόση συζήτηση και τι είναι αυτό που στρέφει το χρηματιστήριο πάνω του

Αλέξανδρος Βασιλείου
είχαν-συνηθίσει-να-τρώνε-με-χρυσά-κου-1274350
Αλέξανδρος Βασιλείου

Τεράστια συζήτηση έχει ανοίξει διεθνώς για την εμφάνιση του Deepseek, chatbot τεχνητής νοημοσύνης κινεζικής προέλευσης που έκανε ιδιαίτερα έντονη την παρουσία του, ιδίως με την ταχύτατη άνοδο στο χρηματιστήριο. Η «μπλε φάλαινα» του μοντέλου αυτού φαίνεται να «σήκωσε πολύ νερό» με τις καταβρεγμένες αμερικανικές εταιρίες να καλούνται σε αφύπνιση, όπως άλλωστε δήλωσε κι ο Ντόναλντ Τραμπ.

Ο αυξανόμενος ανταγωνισμός μεταξύ ΗΠΑ και Κίνας για την κυριαρχία στη σφαίρα της τεχνητής νοημοσύνης κορυφώνεται με αυτή τη νέα εξέλιξη. Άλλωστε, ήδη από την εποχή Μπάιντεν οι ΗΠΑ πήραν μέτρα για να αποτρέψουν το ενδεχόμενο η Κίνα να αποκτήσει την πρωτοκαθεδρία στην τεχνητή νοημοσύνη ενώ η Κίνα ήταν αποκλεισμένη από τσιπ τελευταίας τεχνολογίας.

Σαν αστεροειδής στο χρηματιστήριο

Μέσα σε ένα 24ωρο, ο κινεζικός αντίπαλος του ChatGPT ανέτρεψε πολλές από τις υποθέσεις της Σίλικον Βάλεϊ σχετικά με την οικονομία του AI καθώς και την έκταση του προβαδίσματος των ΗΠΑ έναντι των ανταγωνιστών της.

Το σαββατοκύριακο, η DeepSeek έγινε η δωρεάν εφαρμογή την οποία κατέβασαν περισσότερο oι χρήστες από το αμερικανικό διαδικτυακό κατάστημα της Apple. Μάλιστα,  ξεπέρασε το ChatGPT της OpenAI, που ξεκίνησε την κούρσα της τεχνητής νοημοσύνης στα τέλη του 2022.

Βασικό στοιχείο που συνυπογράφει την επιτυχία της Deepseek είναι το ότι είναι πολύ πιο φθηνή σε σχέση με τους αμερικανικούς κολοσσούς της τεχνητής νοημοσύνης (ΑΙ). Η αλματώδης άνοδος έχει αναστατώσει την Σίλικον Βάλεϊ, προκαλώντας κατηγορίες για απάτη, πτώση στο χρηματιστήριο της Γουόλ Στριτ και προειδοποιήσεις από το Νταβός μέχρι τον Λευκό Οίκο. Παρόλα αυτά, έχει προκαλέσει και μεγάλο θαυμασμό.

Το R1 είναι «εντυπωσιακό. Κυρίως με δεδομένο όσα μπορούν να προσφέρουν με αυτή την τιμή» δήλωσε τ ο Σαμ Άλτμαν, επικεφαλής της OpenAI.

Η DeepSeek λέει ότι χρησιμοποίησε μόλις 2.048 τσιπ τεχνητής νοημοσύνης Nvidia H800 και ξόδεψε 5,6 εκατομμύρια δολάρια για να εκπαιδεύσει το R1 που διαθέτει 671 δισεκατομμύρια παραμέτρους.

Η Nvidia, η οποία απογειώθηκε τα τελευταία δύο χρόνια χάρη στη μεγάλη ζήτηση για τα εξαρτήματά της, κατέρρευσε στο αμερικανικό χρηματιστήριο χθες, χάνοντας σχεδόν 590 δισεκατομμύρια δολάρια.

Η εμφάνιση αυτού του εξαιρετικά χαμηλού κόστους προγράμματος τεχνητής νοημοσύνης προκάλεσε ένα τεράστιο σοκ στη βιομηχανία και αμέσως οι επιπτώσεις αυτού του σοκ έγιναν ορατές στο αμερικανικό χρηματιστήριο όπου προκλήθηκε ένα sell off στον τεχνολογικό κλάδο και μέσα σε λίγες ώρες χάθηκαν πάνω από 1 τρισ. δολάρια κεφαλαιοποίησης.

«Έφαγαν απ’ την αρχή με απλά κουτάλια γιατί αλλιώς δε θα έτρωγαν καθόλου. Και το κατάφεραν»

Η Parallaxi επικοινώνησε με τον Ιωάννη Πήτα, Καθηγητή στο Τμήμα Πληροφορικής στο ΑΠΘ, ο οποίος εξήγησε τι συμβαίνει με αυτό το νέο μοντέλο και ποιοι είναι τελικά οι λόγοι που κάνουν τη Deepseek τόσο ανατρεπτική στον τομέα της τεχνητής νοημοσύνης.

Για το πως λειτουργούσε μέχρι στιγμής το πεδίο, εξηγεί: «Οι μεγάλες αμερικανικές εταιρείες είχαν πολύ μεγάλη υποδομή, πολύ μεγάλα δεδομένα- κλεμμένα απ’ το διαδίκτυο βασικά- και πολλά λεφτά, και άρχισαν να κάνουν όλο και πιο πολύπλοκα γλωσσικά μοντέλα και αυτό το μοντέλο ανάπτυξης δούλευε. Όσο πιο πλούσια μοντέλα κάνανε τόσο πιο καλά πήγαινε το πράγμα και φτάσαμε με αυτόν τον τρόπο στο ChatGPT και έμαθε ο κόσμος την Open AI. Αυτό σημαίνει ότι δημιουργήθηκε μετά ένα τεράστιο οικονομικό πεδίο με μεγάλες προσδοκίες, έγιναν μεγάλες επενδύσεις, οι μετοχές αυτών των εταιριών πήγαν πολύ καλά, όπως και επίσης και των εταιριών Nvidia κλπ, που παρέχουν το hardware για να κάνεις αυτή τη δουλειά κι όλα πήγαιναν ωραία και καλά μέχρι πρόσφατα. Εκείνο το οποίο έπαθαν αυτές οι εταιρίες ήταν ότι πνίγηκαν μες στην επιτυχία τους και τα πολλά λεφτά, γιατί ξέχασαν έναν βασικό τρόπο με τον οποίο δουλεύουμε γενικότερα στην επιστήμη και ειδικά στην πληροφορική και την τεχνητή νοημοσύνη, ότι αναπτύξαμε αυτόν τον τρόπο αλλά μπορείς να κάνεις και πολλά πράγματα απλούστερα».

Ο κ. Πήτας επεξηγεί πως, όπως ο ανθρώπινος εγκέφαλος με το πέρας των χρόνων απλουστεύει συνάψεις και αποδίδει καλύτερα, έτσι μπορεί να γίνει και με τα αντίστοιχα μοντέλα. «Το ίδιο πράγμα μπορούμε να κάνουμε και στις μηχανές. Ή ένα άλλο το οποίο χρησιμοποίησε και η Deepseek: έφτιαξε μεγάλα μοντέλα τα οποία ήταν «δάσκαλοι» και μετά έφτιαξε μικρότερα μοντέλα τα οποία ήταν «μαθητές» και έβαλε τους μαθητές να μάθουν αυτά που ξέρουν οι δάσκαλοι. Από τη στιγμή που μάθανε τα μοντέλα να λύνουν εξίσου καλά τα προβλήματα, μετά δε χρειάστηκε να χρησιμοποιήσουν μεγάλα μοντέλα.

Το αποτέλεσμα είναι ότι έφτιαξε ένα μεγάλο γλωσσικό μοντέλο το οποίο είναι φθηνό και μικρό. Και βεβαίως, μετά το αρπάξαν αυτό τα χρηματιστήρια και έχει αρχίσει να ξεφουσκώνει αυτό που δημιουργήθηκε γύρω από την τεχνητή νοημοσύνη και φτάσαμε εδώ που φτάσαμε.

Υπάρχει μια διαδικασία που λέγεται knowledge distillation, κάτι σαν απόσταξη γνώσης, που ξεκινάει από τα πιο μεγάλα μοντέλα και μετά εκπαιδεύεις πιο μικρά. Και αυτοί ούτως ή άλλως είχαν ξεκινήσει από σχετικά μικρά μοντέλα, είχαν μεγάλο πρόβλημα γιατί δεν τους άφηνε η Αμερική να αγοράσουν τσιπάκια και ενώ οι μεγάλες εταιρίες τρώγανε με χρυσά κουτάλια και δεν καταδέχονταν να φάνε με απλά κουτάλια, οι κινέζοι αναγκάστηκαν από την αρχή να φάνε με απλά κουτάλια γιατί αλλιώς δε θα έτρωγαν καθόλου. Και το κατάφεραν, έκαναν πολύ αρχιτεκτονική, τρέξανε σχετικά μικρά μοντέλα πάνω τους και όλα έγιναν πιο φθηνά και αξιοπρεπώς καλά.

Δεν είναι τίποτα τρομερό αυτό που έχει γίνει, κι ας είδαμε την υπεραντίδραση του χρηματιστηρίου, είναι κάτι το οποίο κάλλιστα μπορούν να το κάνουν οι Αμερικανοί και μάλιστα πάρα πολύ εύκολα. Απλά μέχρι τώρα είχαν μάθει να τρώνε με χρυσά κουτάλια. Τώρα πρέπει να μάθουν να τρώνε με απλά κουτάλια. Θα φτιάξουν κι αυτοί πιο φθηνά μοντέλα»

Θα προλάβει η Ευρώπη το τρένο των εξελίξεων;

Τέλος, για την μεγάλη ευκαιρία και πρόκληση που δημιουργεί για την Ευρώπη η νέα τάξη πραγμάτων στον τεχνολογικό χώρο τονίζει πως «όλα αυτά μπορούν να ευνοήσουν τους πάντες γιατί θα είναι πιο φθηνή η τεχνητή νοημοσύνη, θα έχει λιγότερη κατανάλωση ενέργειας- θα είναι καλύτερη για το περιβάλλον, θα δώσει προοπτική και σε άλλους ανταγωνιστές, όπως στην Ευρώπη και στη χώρα μας που είναι αδρανείς, γιατί ουσιαστικά δείχνει ότι μπορείς να κάνεις πράγματα χωρίς να έχεις τις τεράστιες υποδομές που έχουν οι μεγάλες αμερικάνικες εταιρίες. Τώρα, αν μπορέσει η Ευρώπη και η χώρα μας και πάρει το τρένο πριν ακόμη φύγει- αν δεν έχει φύγει- αυτό θα είναι καλό για όλους. “Απλώνει ο τραχανάς” δηλαδή και σε πιο μικρούς παίκτες».

Αυτό δε σημαίνει όμως ότι οι μεγάλες υποδομές που έφτιαξαν οι αμερικανικές εταιρίες θα πάνε χαμένες. Μπορούν αυτή την υποδομή να τη φτιάξουνε και αντί να λύνει ένα πρόβλημα να λύνει χίλια προβλήματα. Θα την αξιοποιήσουν δηλαδή για να κάνουν πολλά περισσότερα, θα επιταχυνθεί δηλαδή περαιτέρω η ανάπτυξη της τεχνητής νοημοσύνης». 

Σχετικά Αρθρα
Σχετικά Αρθρα