Η «αλματώδης» πρόοδος των μοντέλων τεχνητής νοημοσύνης συνεχίζεται χωρίς καμία επιβράδυνση, με το μοντέλο AI της Google, Gemini, να έχει πλέον τη δυνατότητα να «ζωντανέψει» τις φωτογραφίες μας σε βίντεο.
Η νέα δυνατότητα μετατροπής φωτογραφιών σε βίντεο του Gemini AI τροφοδοτείται από το μοντέλο βίντεο Veo 3 της Google και μπορεί να μετατρέψει εικόνες αναφοράς σε βίντεο οκτώ δευτερολέπτων, τα οποία συνοδεύονται από ήχο που παράγεται από την Τεχνητή Νοημοσύνη, συμπεριλαμβανομένων θορύβων παρασκηνίου, περιβαλλοντικών ήχων και ομιλίας.
Οι χρήστες του Gemini μπορούν να έχουν πρόσβαση στη λειτουργία κάνοντας κλικ στην επιλογή «εργαλεία» στη γραμμή προτροπών, επιλέγοντας «βίντεο» και ανεβάζοντας τη φωτογραφία τους μαζί με μια περιγραφή κειμένου για το πώς θέλουν να κινείται. Μπορούν επίσης να συμπεριληφθούν ηχητικές περιγραφές για διαλόγους, ηχητικά εφέ και περιβαλλοντικό θόρυβο, οι οποίες, σύμφωνα με τη Google, θα είναι «τέλεια συγχρονισμένες με τις εικόνες». Τα τελικά βίντεο παραδίδονται ως αρχεία MP4 σε ανάλυση 720p και σε οριζόντια μορφή 16:9.
Η ενημέρωση για τα βίντεο Gemini είναι τώρα διαθέσιμη στους συνδρομητές Google AI Ultra και Pro «σε επιλεγμένες περιοχές», σύμφωνα με τη Google. Κυκλοφορεί στον ιστό από σήμερα και κατά τη διάρκεια της εβδομάδας…