Che settimana è stata! Negli ultimi giorni abbiamo assistito a due annunci che potrebbero ridefinire il panorama dell’intelligenza artificiale per gli anni a venire. O magari no, vedremo!
Da un lato OpenAI ha lanciato il suo GPT-4o, un modello linguistico multimodale “by design” in grado di interagire attraverso testo, voce e immagini. Dall’altro Google ha presentato al suo evento I/O una serie di novità legate certo al suo motore di ricerca, ma soprattutto a Gemini.
Ma cosa significano davvero questi annunci? E soprattutto, che impatto avranno sul nostro modo di interagire con la tecnologia nel prossimo futuro?
L’AI multimodale (e accessibile a tutti)
La vera novità di GPT-4o sta nella sua natura multimodale. Questo significa che il modello è ora in grado di comprendere e generare non solo testo, ma anche immagini e audio senza passare da una schermata ad un’altra. Cosa vuol dire? Immaginate di poter mostrare a ChatGPT un problema matematico attraverso la webcam e ottenere una risposta in tempo reale, adattata al vostro contesto specifico. O di poter interagire con l’AI usando la voce, in un dialogo fluido e naturale, anche attraverso la fotocamera.
Ma le implicazioni vanno ben oltre la semplice comodità. Pensiamo solo per un secondo a come questa novità potrebbe rivoluzionare il mondo del lavoro: un operaio potrebbe chiedere assistenza a GPT-4o semplicemente inquadrando un macchinario difettoso per ricevere immediatamente risposte sulle azioni da compiere, mentre un medico potrebbe ottenere un secondo parere diagnostico mostrando una lastra al modello etc etc. E che dire del marketing? Immaginate di poter creare campagne personalizzate combinando analisi delle preferenze del target in excel, input testuali, visivi e audio, con GPT-4o che genera slogan, immagini e jingle su misura per il vostro target.
Non solo: GPT-4o sarà disponibile gratuitamente per tutti gli utenti, seppur con alcune limitazioni. Una mossa che potrebbe accelerare enormemente l’adozione di massa dell’AI, rendendola uno strumento alla portata di chiunque. Certo, c’è il rovescio della medaglia: se non paghiamo per il servizio, probabilmente siamo noi il “prodotto”, con i nostri dati e interazioni che serviranno ad addestrare i modelli del futuro. Senza contare che una strategia così aggressiva sui prezzi ha un obiettivo molto chiaro; crescere nel mercato eliminando la concorrenza di possibili competitor più piccoli e con meno risorse economiche.
Ma quale che sia la ragione, è innegabile che si tratti di un passo avanti verso la democratizzazione dell’AI.
La risposta di Google
Al Google I/O sono state annunciate diverse novità per Gemini, a partire da un potenziamento del modello che sarà in grado di gestire fino a 1.500 pagine di testo caricate dagli utenti. C’è poi Gemini Flash, una versione più “leggera” e conveniente pensata per attività rapide come riassumere conversazioni o estrarre dati da documenti.
Pensiamo alle ricadute in termini di produttività: con Gemini potremo analizzare interi library di documenti in pochi istanti, generare report automatici, sintetizzare meeting e call. E nel marketing, potremo usare Gemini per monitorare in tempo reale le conversazioni sui social, individuare trend emergenti, generare contenuti su misura per ogni canale. Insomma, uno strumento potentissimo per lavorare in modo più smart ed efficace.
Ma la vera “killer feature” potrebbe essere Project Astra, il prototipo di assistente AI di nuova generazione sviluppato da DeepMind. Stando alla demo mostrata sul palco, si tratta di un sistema in grado di interagire in modo naturale attraverso video e audio, aiutando l’utente a ritrovare oggetti smarriti, revisionare codice o rispondere a domande su componenti hardware. Un vero e proprio “J.A.R.V.I.S.” domestico che potrebbe sbarcare su Gemini già entro fine anno.
Immaginate cosa potrebbe significare avere un assistente del genere al proprio fianco, capace di supportarvi in ogni aspetto del lavoro e della vita quotidiana. Dalla programmazione al design, dalla stesura di report all’organizzazione di riunioni, Gemini con Astra potrebbe diventare il nostro “braccio destro” virtuale, liberandoci da task ripetitivi per permetterci di concentrarci sulle attività a maggior valore aggiunto.
Cinque previsioni per il futuro dell’IA
Insomma, presentazioni per nulla leggere. Settimane come questa rappresentano punti di snodo fondamentali per capire come si svilupperà il futuro dell’AI e quindi il futuro di … beh quasi tutto. Alla luce di questi annunci credo ci siano cinque possibili trend da tenere d’occhio e da valutare con attenzione all’interno dei nostri modelli di business e di generazione del valore.
-
AI per tutti
Con ogni probabilità vedremo nei prossimi mesi una corsa al ribasso sui prezzi, con i principali attori che renderanno gratuite le loro soluzioni “top di gamma” nel tentativo di conquistare quote di mercato. Una dinamica che potrebbe favorire l’adozione di massa dell’AI.
Pro: facile da capire che grazie a questa strategia l’AI diventa accessibile a chiunque, democratizzando l’accesso a strumenti potenti per la produttività, la creatività, il problem solving. Potremmo assistere a un boom di innovazione e di creatività “dal basso”.
Contro: il rischio potrebbe essere quello di una “commoditizzazione” dell’AI, con modelli sempre più potenti ma poco trasparenti, alimentati con i dati degli utenti. Senza adeguate tutele, potremmo andare verso una sorveglianza diffusa mascherata da “servizio gratuito”. Ma magari ho visto troppo X-Files da giovane… -
Interfacce naturali
Un’accelerazione verso interfacce sempre più naturali e “umane”, basate su input multimodali come voce, video e immagini. In questo scenario, assistenti come Siri potrebbero evolvere rapidamente integrando le capacità di GPT-4o e diciamo che vista la delusione che questi hanno portato fin qui sarebbe anche ora.
Pro: Interagire con l’AI diventerà semplice come parlare con un amico. Potremo accedere a informazioni e servizi in modo istantaneo e contestuale, senza bisogno di apprendere complicati linguaggi di programmazione.
Contro: L’AI potrebbe diventare così “umana” da creare un’illusione di empatia e comprensione che in realtà non possiede. Dobbiamo stare attenti a non antropomorfizzare troppo questi strumenti, ricordandoci che non sono senzienti e che, soprattutto, la vita è da un’altra parte. -
Etica e trasparenza
Evoluzioni di questo tipo non possono che portare un focus crescente sull’etica e la trasparenza, con la necessità di definire standard condivisi per gestire questioni spinose come privacy, bias e disinformazione. Le Big Tech dovranno dimostrare di saper gestire questi temi per non minare la fiducia degli utenti.
Pro: Lo sviluppo di un’AI responsabile e affidabile è cruciale per cogliere appieno i benefici di questa tecnologia. Standard etici condivisi possono creare un level playing field e incentivare pratiche virtuose.
Contro: Il rischio è quello di un’etica “di facciata” (un pò la versione 3.0 del green washing per intendersi), con principi altisonanti che nascondono pratiche opache. Serviranno meccanismi di controllo esterni e sanzioni severe per le aziende che non rispettano le regole. -
AI verticale
Con questo intendo che sia facile prevedere come avremo presto un boom di applicazioni “verticali” basate sull’AI generativa, dalla scrittura alla programmazione, dal design alla ricerca scientifica. Man mano che i modelli diventano più potenti e accessibili, vedremo proliferare tool specializzati per ogni ambito.
Pro: L’AI diventerà uno strumento sempre più prezioso per aumentare la produttività e la creatività in ogni settore. Avremo a disposizione “colleghi virtuali” esperti in campi ultraspecifici.
Contro: Il rovescio della medaglia è un potenziale appiattimento dei prodotti culturali, con l’AI che tende a replicare pattern esistenti anziché innovare. Dovremo imparare a usarla come punto di partenza, non di arrivo. Il rischio è, come diceva il Bersani cantautore, “solo la copia di mille riassunti”. -
Lavoro e automazione
Un impatto dirompente sul mondo del lavoro, con l’automazione di task sempre più complessi. Se da un lato questo potrebbe liberare le persone da attività ripetitive, dall’altro richiederà un ripensamento profondo di molte professioni. La sfida sarà gestire questa transizione in modo inclusivo ed equo.
Pro: L’AI potrebbe aumentare enormemente la produttività, liberando tempo e risorse per attività più gratificanti e creative. Potrebbe anche aprire nuove opportunità di lavoro legate allo sviluppo, alla gestione e alla “cucitura” di questi strumenti.
Contro: Molti lavori rischiano di essere “distrutti” dall’automazione senza preavviso e senza paracadute, con ricadute sociali potenzialmente devastanti. Serviranno politiche lungimiranti di riqualificazione e redistribuzione della ricchezza generata dall’IA.
Al di la delle previsioni, una cosa è certa: l’AI generativa è qui per restare. Nei prossimi anni potrebbe ridefinire in modo radicale il nostro rapporto con la tecnologia e la nostra quotidianità. Sta a noi, come società, imparare a coglierne le opportunità mantenendo al centro di tutto la nostra capacità, unica e speciale, di essere umani.
Sempre avanti, condannati all’ottimismo!
Giuseppe