Το GPT-4o φέρνει πιο ρεαλιστικές εικόνες στο ChatGPT



Η OpenAI προχωρά σε μια σημαντική εξέλιξη στον τομέα της δημιουργίας εικόνων μέσω τεχνητής νοημοσύνης, με τη νέα αναβάθμιση του ChatGPT. Ο CEO της εταιρείας, Sam Altman, αποκάλυψε σε ζωντανή μετάδοση ότι η τελευταία έκδοση του μοντέλου GPT-4o πλέον μπορεί να παράγει και να επεξεργάζεται εικόνες, μια δυνατότητα που δεν υπήρχε στις προηγούμενες εκδόσεις.

Η καινοτομία αυτή φέρνει το ChatGPT σε νέα επίπεδα, καθώς μέχρι πρότινος η τεχνολογία του περιοριζόταν αποκλειστικά στην ανάλυση και δημιουργία κειμένου. Τώρα, το GPT-4o μπορεί να επεξεργάζεται φωτογραφίες, να βελτιώνει λεπτομέρειες και να πραγματοποιεί αλλαγές σε εικόνες με μεγαλύτερη ακρίβεια από το προηγούμενο σύστημα DALL-E 3.

Αυτή η δυνατότητα διατίθεται ήδη για τους συνδρομητές του πακέτου Pro, το οποίο κοστίζει 200 δολάρια το μήνα, τόσο στο ChatGPT όσο και στην πλατφόρμα δημιουργίας βίντεο Sora της OpenAI. Ωστόσο, η εταιρεία έχει ανακοινώσει ότι σύντομα θα είναι διαθέσιμη και για τους χρήστες του ChatGPT Plus, τους δωρεάν χρήστες, καθώς και για προγραμματιστές που χρησιμοποιούν την υπηρεσία API.

Η βελτίωση στη δημιουργία εικόνων σημαίνει ότι το GPT-4o μπορεί να επεξεργάζεται πιο σύνθετες οπτικές πληροφορίες, όπως φωτογραφίες με ανθρώπους ή τοπία, ενώ παράλληλα επιτρέπει την προσαρμογή στοιχείων όπως το φόντο ή τα αντικείμενα σε ένα κάδρο. Οι εικόνες που δημιουργούνται με το GPT-4o εμφανίζουν μεγαλύτερη λεπτομέρεια και ρεαλισμό, καθιστώντας το εργαλείο ακόμα πιο χρήσιμο για επαγγελματικές και δημιουργικές εφαρμογές.

Σύμφωνα με την OpenAI, η εκπαίδευση του GPT-4o έχει βασιστεί σε δημόσια διαθέσιμα δεδομένα, αλλά και σε πληροφορίες που προέρχονται από συνεργασίες με εταιρείες όπως η Shutterstock. Παρόλο που η εταιρεία δηλώνει πως λαμβάνει υπόψη τα δικαιώματα των καλλιτεχνών, η χρήση αυτών των δεδομένων έχει εγείρει συζητήσεις για την προστασία της πνευματικής ιδιοκτησίας και την ηθική της δημιουργίας περιεχομένου μέσω τεχνητής νοημοσύνης.

Η ανακοίνωση της OpenAI έρχεται σε μια περίοδο έντονου ανταγωνισμού μεταξύ εταιρειών AI, καθώς η Google παρουσίασε πρόσφατα το Gemini 2.0 Flash, το οποίο επίσης προσφέρει δυνατότητες δημιουργίας εικόνων. Παρά την εντυπωσιακή λειτουργικότητα του μοντέλου της Google, η έλλειψη ελέγχων οδήγησε σε προβλήματα που σχετίζονται με τα πνευματικά δικαιώματα και την αντιγραφή προστατευμένων εικόνων.

Η OpenAI φαίνεται να δίνει έμφαση στην ακρίβεια και τη διαχείριση της πνευματικής ιδιοκτησίας, προσφέροντας έναν ισορροπημένο συνδυασμό δημιουργικότητας και ηθικής χρήσης της τεχνητής νοημοσύνης. Η νέα αναβάθμιση του ChatGPT αποτελεί ένα ακόμα βήμα προς το μέλλον της AI, καθιστώντας την τεχνολογία πιο προσιτή και αποδοτική για τους χρήστες παγκοσμίως.


{alertInfo}Ακολουθήσετε το Tech News in Greek στο Facebook, στο X και στο Google News για να μαθαίνετε άμεσα όλα τα νέα.