Sora από το OpenAi, εδώ είναι οι διαφορές με το Emu από το Meta και το Lumiere από την Google

Sora από το OpenAi, εδώ είναι οι διαφορές με το Emu από το Meta και το Lumiere από την Google

Το OpenAI λανσάρει το Sora, το εργαλείο AI που δημιουργεί «ρεαλιστικά» και «ευφάνταστα» βίντεο 60 δευτερολέπτων από γρήγορα μηνύματα κειμένου. Η Meta και η Google έχουν επίσης ανακοινώσει ή κυκλοφορήσει τις δικές τους μηχανές μετατροπής κειμένου σε βίντεο. Εδώ είναι λεπτομέρειες και διαφορές


Ο αγώνας της OpenAI, της εταιρείας που υποστηρίζεται από τη Microsoft πίσω από το ChatGpt chatbot και τη γεννήτρια ακίνητων εικόνων DALL-E, στην ανάπτυξη νέων μοντέλων τεχνητής νοημοσύνης δεν σταματά.

Το τελευταίο είναι το Sora, που πήρε το όνομά του από την ιαπωνική λέξη για τον ουρανό. Η ομάδα πίσω από την τεχνολογία του OpenAI επέλεξε αυτό το όνομα επειδή «προκαλεί την ιδέα του απεριόριστου δημιουργικού δυναμικού». Στην πραγματικότητα, είναι μια πλατφόρμα που σας επιτρέπει να δημιουργείτε βίντεο παρέχοντας στο chatbot μόνο πληροφορίες κειμένου με μέγιστη διάρκεια 60 δευτερολέπτων. Το λογισμικό δημιουργίας βίντεο ακολουθεί το chatbot ChatGPT, το οποίο κυκλοφόρησε στα τέλη του 2022 και έχει δημιουργήσει θόρυβο γύρω από τη γενετική τεχνητή νοημοσύνη με την ικανότητά του να συνθέτει μηνύματα ηλεκτρονικού ταχυδρομείου και να γράφει κώδικα και ποίηση.

Προς το παρόν, το Sora δεν είναι διαθέσιμο στο κοινό, ούτε σε δοκιμαστική έκδοση, επίσης επειδή το OpenAI πρέπει ακόμα να κατανοήσει πώς να το προστατεύσει από πιθανά προβλήματα που οφείλονται στην παραγωγή πλαστών βίντεο, που έχουν περάσει ως αληθινά. Στην πραγματικότητα, το OpenAI δηλώνει επικεντρωμένο στην ασφάλεια. Η εταιρεία υπό τον Sam Altman είπε ότι σχεδιάζει να συνεργαστεί με μια ομάδα ειδικών για να δοκιμάσει το πιο πρόσφατο μοντέλο και να εξετάσει προσεκτικά διάφορους τομείς, όπως η παραπληροφόρηση, το περιεχόμενο μίσους και η προκατάληψη.

Όλες οι λεπτομέρειες.

Η ΑΝΑΚΟΙΝΩΣΗ ΣΩΡΑ ΑΠΟ ΤΟ OPENAI

Σε μια ανάρτηση ιστολογίου, το OpenAI είπε ότι ο Sora μπορεί να δημιουργήσει βίντεο μήκους έως και 60 δευτερολέπτων από οδηγίες κειμένου, με δυνατότητα προβολής σκηνών με πολλούς χαρακτήρες, συγκεκριμένους τύπους κίνησης και λεπτομερείς λεπτομέρειες φόντου.

«Το μοντέλο κατανοεί όχι μόνο τι ζήτησε ο χρήστης στην προτροπή, αλλά και πώς υπάρχουν αυτά τα πράγματα στον φυσικό κόσμο», αναφέρει η ανάρτηση στο blog, προσθέτοντας ότι μπορεί να δημιουργήσει πολλές λήψεις σε ένα μόνο βίντεο.

ΔΙΕΥΘΥΝΣΗ ΚΙΝΔΥΝΩΝ

Ένας εκπρόσωπος του OpenAI τόνισε ότι δεν σκοπεύει να καταστήσει το Sora ευρέως διαθέσιμο σύντομα, αφού συνεχίσει να εργάζεται για διάφορα ζητήματα ασφάλειας, συμπεριλαμβανομένων των προσπαθειών για τη μείωση της παραπληροφόρησης, του περιεχομένου μίσους και της μεροληψίας, καθώς και την σαφή επισήμανση του προϊόντος που δημιουργείται από την τεχνητή νοημοσύνη .

Η εταιρεία είπε ότι αναπτύσσει επίσης εργαλεία που μπορούν να διακρίνουν εάν ένα βίντεο δημιουργήθηκε από τη Sora. Η βοήθεια θα πρέπει να προέρχεται από τις ετικέτες που επεξεργάζεται η κοινοπραξία C2pa, η οποία περιλαμβάνει το OpenAI αλλά και τις Meta, Microsoft και Google . Η ιδέα είναι να εισαχθούν πρόσθετα δεδομένα που υπογραμμίζουν την πιθανή δημιουργία ενός αρχείου μέσω τεχνητής νοημοσύνης και να εμποδίσουν τη διάδοσή του στο διαδίκτυο εάν παραβιαστούν οι κοινόχρηστοι κανόνες, σημειώνει η Ansa.

ΔΙΑΓΩΝΙΣΜΟΣ ΜΕ META, GOOGLE ΚΑΙ ΑΛΛΑ

Η OpenAI είναι μεταξύ πολλών εταιρειών που αγωνίζονται να βελτιώσουν αυτόν τον τύπο δημιουργίας στιγμιαίων βίντεο, συμπεριλαμβανομένων νεοφυών επιχειρήσεων όπως η Runway και τεχνολογικών κολοσσών όπως η Google και η Meta, η ιδιοκτήτρια του Facebook και του Instagram. Η τεχνολογία θα μπορούσε να επιταχύνει το έργο έμπειρων κινηματογραφιστών, αντικαθιστώντας πλήρως τους λιγότερο έμπειρους ψηφιακούς καλλιτέχνες, αναφέρουν οι New York Times .

Μόλις πριν από λίγες μέρες, η Google κυκλοφόρησε το Lumiere, μια παρόμοια πλατφόρμα τεχνητής νοημοσύνης που ωστόσο δημιουργεί βίντεο ξεκινώντας από εικόνες που ανέβασε ο χρήστης. Έτσι, το Sora δεν είναι το πρώτο μοντέλο του είδους του, αλλά είναι το μόνο που μπορεί να δημιουργήσει ένα αρχείο διάρκειας έως και 60 δευτερολέπτων. Η Meta ενίσχυσε το μοντέλο παραγωγής εικόνων Emu πέρυσι για να προσθέσει δύο λειτουργίες με τεχνητή νοημοσύνη που μπορούν να επεξεργαστούν και να δημιουργήσουν βίντεο από οδηγίες κειμένου.

ΣΧΟΛΙΟ ΕΙΔΙΚΟΥ

Αν και τα «πολυτροπικά μοντέλα» δεν είναι κάτι καινούργιο και τα μοντέλα κειμένου σε βίντεο υπάρχουν ήδη, αυτό που τα ξεχωρίζει είναι το μήκος και η ακρίβεια που υποστηρίζει το OpenAI η Sora, σύμφωνα με τον Reece Hayden, ανώτερο αναλυτή στην εταιρεία έρευνας αγοράς ABI Research, σύμφωνα με το CNN. .

Ο Hayden είπε ότι αυτοί οι τύποι μοντέλων AI θα μπορούσαν να έχουν μεγάλο αντίκτυπο στις αγορές ψηφιακής ψυχαγωγίας με νέο εξατομικευμένο περιεχόμενο που μεταδίδεται σε κανάλια. «Μια προφανής περίπτωση χρήσης είναι μέσα στην τηλεόραση. δημιουργώντας σύντομες σκηνές για να υποστηρίξουν τις αφηγήσεις», είπε ο Χέιντεν. «Το μοτίβο εξακολουθεί να είναι περιορισμένο, αλλά δείχνει την κατεύθυνση της αγοράς».


Αυτή είναι μια αυτόματη μετάφραση μιας ανάρτησης που δημοσιεύτηκε στο Start Magazine στη διεύθυνση URL https://www.startmag.it/innovazione/sora-di-openai-ecco-le-differenze-con-emu-di-meta-e-lumiere-di-google/ στις Sat, 17 Feb 2024 07:22:19 +0000.