|

OpenAI ha presentato il nuovo modello GPT-4o

Avatar photo
14 Maggio 2024
Il tempo di un caffè

Più potente, più intelligente, più rapido, capace di comprendere perfettamente l’ambiente circostante e gratuito per tutti: il nuovo ChatGPT sembra avere le carte in regola per essere l’AI generativa definitiva. Scopriamo insieme le principali funzionalità introdotte

Il 13 maggio 2024 OpenAI ha tenuto il suo Spring Update, una conferenza stampa trasmessa in diretta per presentare tutte le principali novità introdotte in ChatGPT. Il nuovo modello, rinominato GPT-4o, dove la “o” sta per “omni”, possiede le stesse capacità del modello flagship di OpenAI, GPT-4 Turbo, e ne migliora tutti gli aspetti di comprensione audio e video, le performance in lingua inglese e la rielaborazione di codici.

Riassumendo alcune delle novità introdotte dal nuovo modello GPT-4o, possiamo elencarle in questo senso:

  • Nativamente multimodale: capace di accettare input sotto forma di testo, voce e immagini
  • Maggiormente capace nella comprensione audio-video: performance comparabili a GPT-4 Turbo, migliorata la comprensione di audio e video
  • Gratuito per tutti: gratis per tutti gli utenti, con alcune funzionalità potenziate per gli abbonati a Plus

Il nuovo modello GPT-4o, secondo quanto definito dalla stessa OpenAI, rappresenta “un passo avanti verso una interazione uomo-computer più naturale”, è in grado di comprendere input sotto forma di testo, voce e immagini e pareggia in performance il modello GPT-4 Turbo sui testi in inglese e sui codici.

Secondo quanto mostrato nella demo, GPT-4o sembra essere in grado di guidare gli utenti passo per passo nella risoluzione di problemi matematici, facendo domande pertinenti alla materia in questione.

GPT-4o è in grado di tradurre simultaneamente una conversazione tra due utenti, ricordandosi dei nomi e del tono degli interlocutori.

GPT-4o, sfruttando le fotocamere dei dispositivi elettronici, è in grado di comprendere l’ambiente esterno e, se sollecitato, di formulare ipotesi.

Tramite l’app BeMyEyes, basata su AI, GPT-4o è in grado di offrire agli utenti non vedenti una perfetta panoramica dell’ambiente in cui si trovano, rispondendo a domande e descrivendo lo scenario.

Lo stesso Sam Altman, CEO di OpenAI, che alla conferenza di presentazione ha partecipato in veste di spettatore offrendo al proprio pubblico di X una copertura in diretta dell’evento, ha confermato che il nuovo modello GPT-4o sarà disponibile per tutti gratuitamente, con delle funzionalità potenziate per gli utenti Plus.

Un netto balzo in avanti nella tecnologia a disposizione del grande pubblico, soprattutto data la natura gratuita del nuovo modello GPT-4o.

Ci leggiamo presto!

A cura di
Avatar photo
Gazzetta PRO