L’evento Google I/O ha messo al centro l’intelligenza artificiale mostrando tutte le novità che stanno arrivando per i modelli Gemini: dagli sviluppatori alle aziende, fino agli utenti comuni, Google ha svelato aggiornamenti pensati per rendere l’AI più utile, semplice da usare e vicina alle esigenze di tutti.
La società ha annunciato una serie di novità che arricchiscono la famiglia del suo modello di intelligenza artificiale, Gemini 2.5 Pro già lanciato durante lo scorso marzo e ora in cima alle classifiche di WebDev Arena e LMArena. A riguardo, è in fase di test Deep Think ovvero una modalità di ragionamento avanzata che sfrutta nuove tecniche di ricerca permettendo così al modello di considerare molteplici ipotesi prima di dare una risposta. Anche Gemini 2.5 Flash, il modello predefinito e progettato per velocità e basso costo, è stato perfezionato sotto quasi ogni aspetto ed è disponibile in anteprima in Google AI Studio per gli sviluppatori, in Vertex AI per le aziende e nell’app Gemini per tutti.
L’Api Live di Gemini 2.5 invece introduce l’output audio nativo e il dialogo audio-visivo, per interazioni più naturali con Gemini. Infatti, è possibile personalizzare tono, accento e stile della voce, e il modello può ora eseguire ricerche tramite strumenti. Inoltre, anche la sintesi vocale è stata migliorata con il supporto per due interlocutori e oltre 24 lingue.
Sul fronte della sicurezza, il modello rafforza la protezione contro attacchi sofisticati come le prompt injection indirette mentre per gli sviluppatori arrivano riassunti strutturati del ragionamento, budget per controllare il calcolo dei token e supporto MCP per una migliore integrazione con strumenti open source.
Le nuove funzionalità
Google Workspace punta su un’intelligenza artificiale concreta e con oltre 2 miliardi di assist mensili, Gemini è sempre più integrato nelle app più usate. In Gmail, il modello AI aiuta a scrivere risposte personalizzate, a organizzare la casella con un clic e a fissare appuntamenti tramite Google Calendar, senza cambiare app.
Con Vids, creare video è semplice anche senza competenze tecniche partendo da un prompt testuale e in Google Meet arriva la traduzione vocale in tempo reale che mantiene voce e tono dell’utente, migliorando la comunicazione multilingue – questa novità già disponibile in beta in cinque lingue.
L’app ufficiale di Gemini ha riscosso enorme successo negli ultimi tempi, per questo motivo il team di Google ha pensato di ottimizzarla introducendo nuove funzionalità per un’esperienza ancora più ricca e accessibile. Gemini Live è ora disponibile gratuitamente per tutti gli utenti su Android e iOS, permettendo loro di interagire con l’AI semplicemente inquadrando ciò che li circonda o condividendo lo schermo.
Sul fronte della generazione multimediale arriva Imagen 4, il nuovo modello per creare immagini ad alta qualità, con un rendering del testo migliorato e prestazioni più veloci mentre, per i video, Veo 3 segna un passo avanti: è il primo modello a includere effetti sonori, dialoghi e rumori ambientali in modo nativo.
Anche gli strumenti per creativi e sviluppatori si evolvono, ad esempio Deep Research e Canvas riceveranno aggiornamenti significativi per analizzare dati, produrre podcast e creare app e siti in modalità vibe coding e, molto presto, Gemini sarà integrato anche in Chrome offrendo assistenza diretta durante la navigazione. Debuttano anche il nuovo piano Google AI Pro, in sostituzione a Gemini Advanced, che offre una suite di strumenti AI per 19,99 dollari al mese includendo anche Notebook LM e molto altro con limiti di quota più alti e Google AI Ultra con limiti più ampi e funzionalità esclusive, disponibile solo negli Stati Uniti a 249,99 dollari ma in arrivo prossimamente anche in altri Paesi.
Per chi lavora nel mondo del cinema, arriva Flow: uno strumento AI che usa le tecnologie più avanzate come Veo, Imagen e Gemini per supportare registi e storyteller a trasformare le idee in clip video e scene con qualità da cinema; la novità è disponibile per gli abbonati a Google AI Pro e Google AI Ultra negli Stati Uniti ma è previsto, a breve, il rilascio anche in altri Paesi.
SynthID Detector
E per fronteggiare i continui progressi nell’intelligenza artificiale generativa che stanno rivoluzionando la creazione di contenuti permettendo di generare testo, immagini, audio e video in modo sempre più sofisticato ma sollevando problematiche legate all’autenticità e alla verifica delle fonti, Google ha svelato SynthID Detector: un portale che permette di identificare rapidamente contenuti generati con l’AI, grazie a filigrane digitali invisibili. Il sistema è in grado di analizzare immagini, audio, video e testi creati con i modelli di Google e segnalare le parti contrassegnate: tuttavia, la novità è attualmente disponibile in anteprima per alcuni tester, sarà presto accessibile a un pubblico più ampio.
Con queste novità, e altre annunciate, Google conferma il suo impegno nello sviluppo di un’intelligenza artificiale utile, accessibile e integrata nella quotidianità: Gemini, con le sue applicazioni pratiche e innovative, rappresenta un passo concreto verso un futuro in cui tecnologia e persone collaborano in modo sempre più naturale, produttivo ma soprattutto sicuro.