Rechercher dans ce blog

Wednesday, January 24, 2024

AI, arriva la ChatGpt addestrata in italiano: cos’è Modello Italia e perché è diversa dalle altre - Corriere della Sera

«Il nostro obiettivo è che quando si parla dell’intelligenza artificiale si pensi alla Ferrari dell’AI». Con queste premesse l’imprenditore italiano di origine albanese Uljan Sharka il 24 gennaio 2024 ha annunciato a Milano la nascita di «Modello Italia», praticamente la ChatGpt nazionale che verrà rilasciata entro l’estate 2024. Si tratta di un modello di intelligenza artificiale generativa (come la celebre ChatGpt sviluppata dall’americana OpenAI) addestrata però con dataset nella nostra lingua, e non con l’inglese. Il punto di forza, quindi, diventa l’eliminazione di tutti quei bias culturali e quei pregiudizi tipici di una cultura anglofona, ben diversa dalla nostra.

Uljan Sharka
Uljan Sharka

Fondatore della società deep-tech iGenius, con sede a Milano, le cui soluzioni sono state adottate da numerose aziende (incluse quelle della Fortune 500), Sharka ha precisato che l’ambizioso progetto di Modello Italia verrà sviluppato utilizzando la capacità di calcolo del supercomputer Leonardo, il sesto più potente al mondo, gestito dal Cineca di Bologna (Consorzio Interuniversitario formato da 118 enti pubblici, tra cui due Ministeri e 70 università italiane). La Gpt italiana, quindi, dovrebbe rappresentare un grande sostegno per aziende, startup e pubblica amministrazione. «C’è già stato un approfondito dialogo con le istituzioni e abbiamo ricevuto un feedback molto positivo. Anzi, ci aspettiamo da parte loro un’adozione del progetto», commenta Sharka.

Italia leader nell’AI

«Credo che l’Italia possa diventare un leader naturale nella corsa all’AI – sostiene Sharka -. Non siamo mai riusciti a entrare nella corsa dello sviluppo tecnologico in generale, quando è partita si erano già formati i colossi americani, ma ora siamo alla fine di quel ciclo e l’intelligenza artificiale segna l’inizio di un nuovo mondo. E abbiamo la possibilità di creare nuovi leader per definire il futuro dell’economia globale. Se il mercato dell’AI valeva 100 miliardi di dollari nel 2022 e 200 nel 2023, le stime prevedono che raggiungerà diversi trilioni entro il 2030. E farà crescere le economie di tutto il mondo. È una rivoluzione industriale».

Utilizzo anche offline

Il primo foundational model italiano sarà totalmente open-source con una licenza aperta fornita dal Mit. Uno degli obiettivi di iGenius è infatti la democratizzazione della tecnologia. Sarà addestrato con diversi trilioni di token per competere a livello internazionale con i primi dieci top model mondiali. Con una caratteristica molto chiara: «Vogliamo rappresentare un Rinascimento digitale, un approccio tutto italiano con l’uomo al centro – spiega ancora Sharka -. Molti modelli partono dalla grande quantità di dati e dall’architettura tecnologica, lasciando fuori le conseguenze e gli impatti descritti molto bene nell’AI Act, che toccano i diritti umani. Con Modello Italia siamo partiti dall’uomo, dalla lingua e da un grande lavoro nel selezionare i dataset e le informazioni che verranno tokenizzate per creare il primo large language model italiano, garantendo la sovranità dei dati e della proprietà intellettuale. Avere già le indicazioni dell’AI Act ci ha permesso di sviluppare Modello Italia rispettandone le linee guida. La grande rivoluzione sarà la possibilità di utilizzare la tecnologia anche in modalità offline: gli utenti potranno fare un download totale del sistema nel proprio device, senza mandare i dati fuori dal proprio dispositivo».

Certificazione della conoscenza

Sharka insiste molto sul tema dell’italianità, ritenendo che si stia sottovalutando l’effetto che questi LLM avranno tra 10 o 20 anni: «I modelli principali, OpenAI, Anthropic, Google e Meta usano dati inglesi, così come la francese Mistral e addirittura la cinese 01.AI. Ma stiamo parlando di una tecnologia strategica che definirà l’economia, e i Paesi devono governare e processare i dati in modo sicuro. Per l’Italia significherebbe mettere il proprio tessuto economico e la proprietà intellettuale nelle mani di una terza parte. Per questo bisogna avere una certificazione della conoscenza, e non più affidarsi a modelli in cui vengono riversati molti dati di cui non si sa la provenienza. Anche perché le imprese rischierebbero danni da milioni di euro». All’inizio Modello Italia è stato addestrato esclusivamente con dati italiani, in seguito verrà implementato anche in altre lingue.

Quanto è costato il progetto? «Molto!», risponde Sharka puntualizzando che è stato fatto un aumento di capitale anche se non può ancora rivelare le cifre, «nulla a che fare però con i mega investimenti di OpenAi o Google. Per quanto riguarda le risorse stiamo cambiando scala». Perché mettere la parola Italia nel nome? «Perché mi piace vederla tra i primi modelli di LLM al mondo, lo vedo come un punto di forza».

Corriere della Sera è anche su Whatsapp. È sufficiente cliccare qui per iscriversi al canale ed essere sempre aggiornati.

Adblock test (Why?)


AI, arriva la ChatGpt addestrata in italiano: cos’è Modello Italia e perché è diversa dalle altre - Corriere della Sera
Read More

No comments:

Post a Comment

Tim in Borsa chiude a +2,2% in attesa offerta Kkr su Sparkle - Ultima ora - Ansa.it - Agenzia ANSA

Tim chiude tonica in Borsa e indossa la maglia rosa nel listino principale, in attesa dell'offerta di Kkr per Sparkle e il dossier su N...