Big brother μέσα στο 2025: Το AI θα βλέπει ό,τι βλέπουμε και θα μας προτείνει πράγματα;
Τι είναι το Copilot Vision;
Από τότε που η τεχνητή νοημοσύνη «εισέβαλλε» στη ζωή μας, η παρουσία της είναι τόσο έντονη που σχεδόν δεν μπορούμε να θυμηθούμε πως ήταν η ζωή πριν από αυτή. Παρά τους φόβους, η βιομηχανία της τεχνολογίας ποντάρει στο ότι η τεχνητή νοημοσύνη μπορεί να βελτιώσει τα πάντα, από τα κινητά μέχρι τις σχέσεις μας με τα ζώα.
Με το 2025 να πλησιάζει, δεν υπάρχει έλλειψη λανσαρισμάτων προϊόντων που βασίζονται στην τεχνητή νοημοσύνη. Η OpenAI μόλις ανακοίνωσε τη Sora, τη πολυαναμενόμενη γεννήτρια φωτορεαλιστικών βίντεο, ως μέρος του “Shipmas,” μιας 12ήμερης σειράς κυκλοφοριών προϊόντων που θυμίζει Χριστούγεννα. Το Reddit λάνσαρε ένα εργαλείο αναζήτησης με τεχνητή νοημοσύνη που σας βοηθά να αξιοποιήσετε τη συλλογική του «σοφία» χωρίς να χρησιμοποιήσετε το Google. Αυτό, βέβαια, δεν θα πρέπει να ανησυχεί την Google, η οποία παρουσίασε ένα νέο τσιπ κβαντικής πληροφορικής, ονόματι Willow, που υπόσχεται να εκτοξεύσει τις δυνατότητες της τεχνητής νοημοσύνης.
Από το «παιχνίδι» δε μπορεί να λείπει και η Microsoft. Η εταιρεία αποτελεί έναν από τους πρώτους παίκτες στην γενετική τεχνητή νοημοσύνη, έχοντα επενδύσει 13 δισεκατομμύρια δολάρια στην OpenAI. Τώρα, η Microsoft ενίσχυσε τη συλλογή των προϊόντων της που βασίζονται στην τεχνητή νοημοσύνη τους τελευταίους μήνες. Τον Μάρτιο, η εταιρεία εξαγόρασε την Inflection AI και διόρισε τον συνιδρυτή της, Mustafa Suleyman, ως διευθύνοντα σύμβουλο της Microsoft AI, υπεύθυνο για τα καταναλωτικά προϊόντα τεχνητής νοημοσύνης, όπως το Copilot, το Bing και το Edge.
Η μεγάλη κυκλοφορία προϊόντος της Microsoft στις αρχές Δεκεμβρίου δεν συγκρίνεται σε κλίμακα και φήμη με τη Sora, αλλά το νέο εργαλείο τεχνητής νοημοσύνης κάνει κάτι εντελώς πρωτότυπο.
Ο λόγος για το Copilot Vision. Η βασική ιδέα είναι ότι το Vision επιτρέπει στο Copilot, το chatbot της Microsoft που βασίζεται στην τεχνητή νοημοσύνη, να βλέπει αυτό που βλέπετε εσείς στον περιηγητή σας. Η Microsoft αποκαλεί το Copilot έναν «συνοδό τεχνητής νοημοσύνης», και με το Vision, αυτό αποκτά νόημα. Αν, για παράδειγμα, ψωνίζετε έπιπλα από το Wayfair, μπορείτε να ζητήσετε από το Copilot να βρει κάτι με ένα ύφος σχεδίασης τύπου Memphis, ακόμη κι αν δεν έχετε ιδέα τι σημαίνει «ύφος σχεδίασης Memphis». Το Copilot στη συνέχεια σαρώνει ολόκληρη την ιστοσελίδα, αναζητώντας εικόνες που ταιριάζουν με αυτό που ζητάτε, και σας καθοδηγεί προς τη σωστή κατεύθυνση. Με άλλα λόγια, μπορεί να δει αυτό που βλέπετε στο Wayfair και να απαντήσει σε όλες τις ερωτήσεις σας σχετικά με αυτό.
Υπάρχουν πολλές επιφυλάξεις εδώ. Το Copilot Vision κυκλοφορεί σε προεπισκόπηση για περιορισμένο αριθμό συνδρομητών του Copilot Pro που έχουν εγγραφεί και στο Copilot Labs. Πρέπει να χρησιμοποιείτε τον περιηγητή Edge και λειτουργεί μόνο σε ορισμένες ιστοσελίδες. Επίσης, η Microsoft διαγράφει όλες τις πληροφορίες από κάθε συνεδρία μετά την ολοκλήρωσή της, κάτι που βοηθά στην προστασία της ιδιωτικότητάς σας.
Σε μια πρόσφατη συνέντευξη, ο Mustafa Suleyman εξήγησε γιατί η συνεργασία με την τεχνητή νοημοσύνη είναι το μέλλον της πληροφορικής. Αυτό είναι κάτι που ακούγεται από τις εταιρείες τεχνολογίας εδώ και χρόνια. Αλλά με την πορεία που ακολουθούν τα πράγματα, ίσως τώρα να είναι εφικτό.
Ακολουθεί η συνέντευξη του Mustafa Suleyman:
Πώς αισθάνεστε για το πού βρισκόμαστε αυτή τη στιγμή; Είστε έκπληκτος με το πόσο mainstream έχει γίνει η τεχνητή νοημοσύνη το 2024, ή πιστεύατε ότι θα ήμασταν πιο μπροστά ή πιο πίσω;
Μέρος μου αισθάνεται ότι ήταν απογοητευτικά αργό και ότι θα μπορούσαμε να σημειώνουμε περισσότερη πρόοδο πιο γρήγορα. Αλλά ένα άλλο μέρος μου είναι απλώς κατακλυσμένο από το πόσο εκπληκτικά είναι αυτά τα μοντέλα. Για πρώτη φορά στην ιστορία, έχουμε στην πραγματικότητα περισσότερη επιστήμη απ’ ό,τι ξέρουμε πώς να εφαρμόσουμε σε τεχνολογία και προϊόντα. Αυτά τα μεγάλα γλωσσικά μοντέλα που αναπτύσσουμε, μόλις αρχίζουμε να καταλαβαίνουμε τα όρια που έχουν και τι δεν μπορούν να κάνουν. Κάθε εβδομάδα βλέπω ανθρώπους να ξεκλειδώνουν νέες δυνατότητες.
Πιθανότατα είναι η πιο δημιουργική περίοδος που μπορώ να θυμηθώ στη βιομηχανία τεχνολογίας, όσον αφορά την εφεύρεση και τη δημιουργία νέων εμπειριών. Αυτό είναι που με ενδιέφερε πάντα: πώς δημιουργώ μια προσωπική τεχνητή νοημοσύνη ή έναν προσωπικό συνοδό τεχνητής νοημοσύνης; Πώς κάνω τους ανθρώπους να νιώθουν ότι έχουν έναν ομαλό, άνετο, συνομιλητικό συνοδό στη γωνία τους που τους βοηθά στην καθημερινότητά τους; Και τώρα έχω πραγματικά τον “πηλό” για να διαμορφώσω αυτό το νέο είδος στα χέρια μου.
Ποιες θεωρείτε ότι είναι οι κύριες επιφυλάξεις που έχουν οι άνθρωποι σχετικά με τη χρήση τεχνητής νοημοσύνης;
Τις περισσότερες φορές, οι άνθρωποι ρωτούν τον εαυτό τους: «Για τι να το χρησιμοποιήσω;». Όπως κάθε νέα, γενικής χρήσης τεχνολογία που μπορεί να κάνει τα πάντα, αφήνει τον χρήστη να αναρωτιέται: «Εφόσον μπορεί να κάνει τα πάντα, τι ακριβώς να κάνω εγώ μ’ αυτό;». Γι’ αυτό σχεδιάσαμε το Copilot με τέτοιο τρόπο ώστε να καθοδηγεί τη συζήτηση. Κάνει έξυπνες ερωτήσεις. Είναι διερευνητικό. Ακούει ενεργά όταν βρίσκεστε στη φωνητική λειτουργία. Διακόπτει τη συζήτηση τη σωστή στιγμή. Έχει διαφορετική προσωδία και ρυθμό ανάλογα με το θέμα της συνομιλίας.
Προσπαθήσαμε να ξεπεράσουμε κάποιους περιορισμούς, αυτό που αποκαλούμε «πρόβλημα της κρύας εκκίνησης» — το να ξέρεις πώς να αξιοποιήσεις μια τεχνολογία ή από πού να ξεκινήσεις μια συνομιλία — δημιουργώντας μια πολύ πιο ομαλή και άνετη αλληλεπίδραση.
Οι φωνητικοί βοηθοί, όπως η Siri και η Alexa, υπάρχουν εδώ και καιρό. Γνωρίζω πολλούς ανθρώπους που δεν τους χρησιμοποιούν καθημερινά. Εγώ δεν τους χρησιμοποιώ καθημερινά. Πιστεύετε ότι χρειάζεται μια στιγμή “ανατροπής” — ίσως αυτή είναι η στιγμή — για να αρχίσουν οι άνθρωποι να μιλούν στους υπολογιστές τους και να το νιώθουν φυσικό;
Εγώ χρησιμοποιώ φωνή κάθε μέρα τώρα. Είναι το πρώτο πράγμα που κάνω όταν σκέφτομαι να ψάξω κάτι. Είναι πολύ πιο γρήγορο. Είναι πολύ πιο εύκολο. Είναι πολύ πιο ακριβές από το να πληκτρολογήσω στο τηλέφωνό μου ή στο πληκτρολόγιό μου. Και το εκπληκτικό με αυτό είναι ότι μπορεί να σας κάνει ερώτηση και να συνεχίσει τον διάλογο. Είναι μια εντελώς νέα μορφή.
Για πρώτη φορά, λειτουργεί πραγματικά. Σε αντίθεση με το παρελθόν, όπου οι φωνητικές εντολές περιορίζονταν σε μερικές προκαθορισμένες φράσεις, όπως «άναψε τα φώτα» ή «ποια είναι η πρωτεύουσα της Γαλλίας» και δεν λειτουργούσαν πολύ καλά. Σήμερα, είναι σαν να μιλάς με έναν φίλο, και αυτό ξεκλειδώνει έναν διαφορετικό τύπο αλληλεπίδρασης. Δεν περιορίζεσαι πια στο να διαμορφώνεις τις σκέψεις σου σε μια αναζήτηση, να διαβάζεις μια σειρά από συνδέσμους στη σελίδα αποτελεσμάτων και μετά να κοιτάς αυτή την ιστοσελίδα. Μπορείς απλώς να ρωτήσεις το Copilot, σαν να μιλάς σε έναν φίλο ή έναν γνώστη ή σύμβουλο.
Αυτό το όραμα για την τεχνητή νοημοσύνη ανοίγει πραγματικά νέους δρόμους.
*Με πληροφορίες από Vox/ Adam Clark Estes