OpenAI Lancia GPT-4o: Intelligenza Artificiale Multimodale Accessibile a Tutti

OpenAI ha recentemente lanciato GPT-4o, un nuovo modello di intelligenza artificiale progettato per migliorare l’interazione umana-computer. GPT-4o (“o” per “omni”) è in grado di accettare come input qualsiasi combinazione di testo, audio, immagini e video, e di generare output in forma di testo, audio e immagini. Questo modello segna un notevole passo avanti rispetto ai modelli precedenti, grazie alla sua capacità di elaborare input e output multimodali attraverso un’unica rete neurale, riducendo così i tempi di latenza e migliorando l’efficacia delle risposte.

Una delle caratteristiche distintive di GPT-4o è la sua velocità di risposta agli input audio, che può essere di appena 232 millisecondi, con una media di 320 millisecondi, simile al tempo di risposta umano in una conversazione. Questo rappresenta un miglioramento significativo rispetto ai tempi di latenza di Voice Mode nei modelli precedenti, come GPT-3.5 e GPT-4.

GPT-4o

GPT-4o si distingue anche per le sue capacità avanzate di comprensione visiva e uditiva, che gli permettono di interpretare toni di voce, rilevare e interpretare espressioni facciali umane, e rispondere con emozioni, risate e canto. Queste caratteristiche rendono le interazioni più naturali e coinvolgenti. Il modello è stato testato e valutato attraverso un rigoroso processo di red teaming con oltre 70 esperti esterni in vari campi, per garantire la sicurezza e mitigare i rischi associati alle nuove capacità multimodali.

Il lancio di GPT-4o è stato accompagnato da una serie di dimostrazioni pratiche che includono traduzione simultanea, assistenza nella risoluzione di equazioni matematiche e narrazione di storie in vari toni. Il modello sarà disponibile gratuitamente per tutti gli utenti registrati, con un’ampia distribuzione pianificata nei prossimi mesi. Gli utenti Plus avranno accesso anticipato a nuove funzionalità, come una nuova modalità vocale basata su GPT-4o, mentre gli sviluppatori potranno accedere al modello attraverso l’API di OpenAI.

Inoltre, è stata annunciata una nuova app di ChatGPT, inizialmente disponibile solo per utenti Mac, che permetterà di utilizzare il chatbot per varie funzioni, come il riconoscimento di elementi visivi e testuali sullo schermo. Questa applicazione sarà scaricabile gratuitamente, ma inizialmente riservata agli utenti abbonati.

In sintesi, GPT-4o rappresenta un passo significativo verso una maggiore accessibilità e usabilità delle tecnologie di intelligenza artificiale, offrendo miglioramenti in velocità, capacità multimodali e interazione naturale, rendendo la tecnologia AI più inclusiva e avanzata per tutti gli utenti.

Per leggere tutti i dettagli visita il sito di OpenAI.

Source: wired.it, openai.com, corriere.it

Banksy Bruciato

Grazie per aver letto il nostro Articolo!

Clicca sull' icona per tornare alla home page