Δείτε πώς το OpenAI μετατρέπει το ChatGpt σε Siri και Alexa

Δείτε πώς το OpenAI μετατρέπει το ChatGpt σε Siri και Alexa

Τώρα το ChatGpt μιλάει και βλέπει. Χάρη στις νέες δυνατότητες, το chatbot της εταιρείας OpenAI θα μπορεί να συνομιλεί με τη δική του φωνή όπως η Siri, ο φωνητικός βοηθός της Apple ή η Alexa της Amazon ή ο βοηθός της Google, καθώς και να αναλύει φωτογραφίες

Όλο και πιο «έξυπνη» τεχνητή νοημοσύνη: Το ChatGpt μπορεί πλέον να βλέπει, να ακούει και να μιλά.

Το OpenAI συνεχίζει να ενημερώνει το γενετικό του chatbot AI από την κυκλοφορία του τον περασμένο Νοέμβριο και έγινε αμέσως φαινόμενο: η εταιρεία εξήγησε ότι το chatbot σύντομα θα μπορεί να συνομιλεί με τους χρήστες μέσω φωνής, μιμούμενος αυτό ενός πραγματικού προσώπου, εκτός από τη δυνατότητα ανάλυσης τις φωτογραφίες που ανεβάζει ένας χρήστης στην πλατφόρμα.

Οι νέες δυνατότητες δίνουν στο chatbot περισσότερη χρησιμότητα αυτή τη στιγμή και δείχνουν ένα μέλλον όπου τα εργαλεία τεχνητής νοημοσύνης κατανοούν τον κόσμο γύρω τους, όχι μόνο τα διαδικτυακά δεδομένα στα οποία εκπαιδεύτηκαν.

Αυτό φέρνει το ChatGpt πιο κοντά σε παρόμοιες υπηρεσίες AI, όπως το Siri της Apple, ο φωνητικός βοηθός της Google και η Alexa της Amazon. Οι ενημερώσεις επηρεάζουν την επίσημη εφαρμογή για Android και iOS και θα είναι διαθέσιμες σε δύο εβδομάδες για πελάτες που πληρώνουν για συνδρομή Plus ή Enterprise , με στόχο αποκλειστικά σε επιχειρήσεις.

Η ανακοίνωση έρχεται την ίδια ημέρα που η Amazon δεσμεύτηκε να επενδύσει έως και 4 δισεκατομμύρια δολάρια στον ανταγωνιστή του OpenA I, Anthropic, μια κίνηση που αποτελεί μέρος μιας ευρύτερης μάχης μεταξύ των τεχνολογικών γίγαντων του κόσμου για τη δημιουργία τεχνητής νοημοσύνης. περιλαμβάνει την Google να κάνει catch-up μέσω του Bard chatbot της , η Meta υιοθετεί ένα ισχυρό ήθος ανοιχτού κώδικα για να τη βοηθήσει να αποκτήσει πλεονέκτημα και η Microsoft με το ίδιο το OpenAI, σημειώνει το TechCrunch .

Όλες οι λεπτομέρειες.

ΟΙ ΝΕΕΣ ΔΥΝΑΤΟΤΗΤΕΣ CHATGPT

Από τώρα και στο εξής, το ChatGpt μπορεί επίσης να λέει ιστορίες πριν τον ύπνο, να επιλύει συζητήσεις στο τραπέζι του δείπνου και να εκφωνεί φωναχτά τη εισαγωγή κειμένου από τους χρήστες.

«Η νέα λειτουργία φωνής τροφοδοτείται από ένα νέο μοντέλο, ικανό να παράγει ήχο που μοιάζει με άνθρωπο, ξεκινώντας μόνο από κείμενο και μερικά δευτερόλεπτα δειγματοληψίας φωνής», εξήγησε το OpenAI μέσω μιας ανάρτησης στο ιστολόγιο της εταιρείας . «Συνεργαστήκαμε με επαγγελματίες φωνητικούς ηθοποιούς για να δημιουργήσουμε κάθε μία από τις φωνές. Χρησιμοποιούμε επίσης το Whisper, το σύστημα αναγνώρισης ομιλίας ανοιχτού κώδικα, για να μεταγράψουμε τις προφορικές σας λέξεις σε κείμενο."

Σε μια επίδειξη της νέας ενημέρωσης που κοινοποιήθηκε από το OpenAI, ένας χρήστης ζητά από το ChatGPT να φτιάξει μια ιστορία για τον «σούπερ ηλίανθο σκαντζόχοιρο που ονομάζεται Larry». Το chatbot μπορεί να αφηγηθεί μια ιστορία δυνατά με ανθρώπινη φωνή που μπορεί επίσης να απαντήσει σε ερωτήσεις όπως "Πώς ήταν το σπίτι σας;" και «Ποιος είναι ο καλύτερος φίλος του;», αναφέρει το CNN .

Η λειτουργία φωνής «ανοίγει την πόρτα σε πολλές δημιουργικές εφαρμογές που εστιάζουν στην προσβασιμότητα», τόνισε το OpenAI.

ΔΙΑΒΑΣΤΕ ΦΩΤΟΓΡΑΦΙΕΣ ΣΑΝ ΦΑΚΟΣ GOOGLE

Σε ό,τι αφορά τη δεύτερη καινοτομία, την «ανάγνωση» των εικόνων, το OpenAI υπογραμμίζει ότι σύντομα θα είναι δυνατή η αποστολή φωτογραφιών στο πλαίσιο συνομιλίας με το ChatGpt για να τις αναλύσει και να παρέχει σε βάθος πληροφορίες. Μπορείτε, για παράδειγμα, να τραβήξετε μια φωτογραφία μιας σειράς συστατικών και να αφήσετε το AI να δημιουργήσει ένα πιάτο από αυτά, με τα βήματα για να το φτιάξετε.

Επί του παρόντος, μια δημοφιλής υπηρεσία για τη λήψη πληροφοριών σχετικά με εικόνες είναι ο φακός Google της Alphabet.

Επιπλέον, το OpenAI είπε την περασμένη εβδομάδα ότι το ChatGPT σύντομα θα μπορεί επίσης να δημιουργεί εικόνες, χάρη στην ενσωμάτωση με το DALL-E 3, αναφέρει το The Verge.

ΣΥΝΕΡΓΑΣΙΑ ΜΕ ΤΟ SPOTIFY

Ταυτόχρονα, το OpenAI ανακοίνωσε μια συνεργασία με το Spotify για τη μετάφραση πρωτότυπων αγγλόφωνων podcast στα ισπανικά και γαλλικά, χάρη στην τεχνητή νοημοσύνη του. Συγκεκριμένα, οι podcasters θα μπορούν να δοκιμάσουν τη δική τους φωνή και να μεταφράσουν τις εκπομπές τους, διατηρώντας παράλληλα την αρχική τους φωνή.

ΤΑ ΠΡΩΤΑ ΣΧΟΛΙΑ

Έτσι, οι νέες δυνατότητες δίνουν στο chatbot περισσότερη χρησιμότητα αυτή τη στιγμή και υποδεικνύουν ένα μέλλον όπου τα εργαλεία AI κατανοούν τον κόσμο γύρω τους, όχι μόνο τα διαδικτυακά δεδομένα στα οποία εκπαιδεύτηκαν, επισημαίνει η Axios .

Σχεδόν ένα χρόνο μετά την αρχική κυκλοφορία του ChatGpt, το OpenAI φαίνεται ακόμα να προσπαθεί να βρει πώς να δώσει στο bot του περισσότερες δυνατότητες και δυνατότητες χωρίς να δημιουργήσει ένα νέο σύνολο προβλημάτων και μειονεκτημάτων, σχολιάζει το The Verge . «Με αυτές τις εκδόσεις, η εταιρεία προσπάθησε να ακολουθήσει αυτή τη γραμμή περιορίζοντας σκόπιμα το τι θα μπορούσαν να κάνουν τα νέα μοντέλα της. Αλλά αυτή η προσέγγιση δεν θα λειτουργεί για πάντα. Καθώς όλο και περισσότεροι άνθρωποι χρησιμοποιούν φωνητικό έλεγχο και αναζήτηση εικόνων, και καθώς το ChatGPT πλησιάζει όλο και περισσότερο στο να γίνει ένας πραγματικά πολυτροπικός και χρήσιμος εικονικός βοηθός, θα γίνεται όλο και πιο δύσκολο να διατηρηθούν τα προστατευτικά κιγκλιδώματα».


Αυτή είναι μια αυτόματη μετάφραση μιας ανάρτησης που δημοσιεύτηκε στο Start Magazine στη διεύθυνση URL https://www.startmag.it/innovazione/ecco-come-openai-trasforma-chatgpt-in-siri-e-alexa/ στις Tue, 26 Sep 2023 10:56:25 +0000.