Viaggio

Picture Perfect: Google presenta Whisk, lo strumento AI che parla nelle immagini

Pubblicità

L'ultima aggiunta alla gamma di strumenti di intelligenza artificiale di Google è il prodotto rivoluzionario noto come "Whisk". Questo strumento innovativo consente agli utenti di caricare semplicemente le fotografie e di ricevere un'immagine combinata generata dall'intelligenza artificiale, senza dover digitare una sola parola.

A differenza dei tradizionali editor di immagini, Whisk si concentra sul fornire agli utenti uno strumento creativo e stimolante, piuttosto che su capacità di editing professionali. Google ha descritto Whisk come una piattaforma per l'esplorazione visiva rapida, in cui gli utenti possono sperimentare soggetti, scene e stili diversi per generare immagini uniche e coinvolgenti.

Negli ultimi anni, le grandi aziende tecnologiche come Google e OpenAI sono state in prima linea nello sviluppo di tecnologie di intelligenza artificiale all'avanguardia da offrire ai consumatori. Con l'introduzione di strumenti come Dall-E di OpenAI, che consente la generazione di testo in immagini, e ora Whisk di Google, le possibilità per la creatività e l'arte generate dall'intelligenza artificiale sono diventate illimitate.

Utilizzando il principale servizio di intelligenza artificiale di Google, Gemini, e il nuovissimo generatore di testo in immagini di DeepMind, Imagen 3, Whisk è in grado di offrire agli utenti un'esperienza fluida e intuitiva per la creazione di immagini straordinarie. Il processo prevede che gli utenti carichino le fotografie e che lo strumento catturi l'essenza del soggetto, della scena e dello stile per generare un'immagine unica e personalizzata.

Una delle caratteristiche principali di Whisk è la possibilità per gli utenti di remixare diverse categorie e input per creare un'ampia gamma di prodotti, come peluche, spille smaltate e adesivi. Gli utenti possono anche fornire istruzioni verbali per personalizzare i dettagli, sebbene non sia sempre necessaria un'immagine affinché lo strumento generi un'immagine.

Thomas Iljic, direttore della gestione dei prodotti di Google Labs, ha sottolineato che Whisk è progettato per offrire agli utenti un modo divertente e creativo per esplorare rapidamente concetti visivi, anziché concentrarsi sul raggiungimento di modifiche perfette al pixel. Con Whisk, gli utenti possono sperimentare diverse combinazioni di soggetti e stili per creare immagini visivamente sorprendenti che riflettono la loro prospettiva unica e la loro creatività.

Nonostante sia in fase di sviluppo iniziale e disponibile solo negli Stati Uniti, Whisk ha già ricevuto elogi per il suo approccio innovativo alla creazione di immagini generate dall'intelligenza artificiale. Grazie al continuo progresso delle tecnologie e degli strumenti di intelligenza artificiale come Whisk, Google si sta posizionando come leader nei settori dell'intelligenza artificiale e della tecnologia, mettendo in mostra le sue capacità e ampliando i confini di ciò che è possibile realizzare con l'intelligenza artificiale.

Come parte della roadmap dei prodotti Google per il 2025, che include collaborazioni con giganti del settore come Samsung e Qualcomm per un nuovo sistema operativo Android, strumenti di intelligenza artificiale come Whisk sono considerati una componente chiave per la crescita e il successo futuri dell'azienda. Sfruttando la potenza dell'intelligenza artificiale e dell'apprendimento automatico, Google è in grado di offrire agli utenti modi nuovi ed entusiasmanti di interagire con la tecnologia e di liberare la propria creatività come mai prima d'ora.

Circa l'autore  /  Anna Munhoz