Su Repubblica tra le IA linguistiche in italiano e open source c'è anche CERBERO

06 Marzo 2024
590
VIEW

Cerbero è il primo modello di linguaggio di grandi dimensioni (LLM) italiano distribuito con una licenza open source che ne permette l'uso anche in contesti commerciali.

 

La Repubblica dedica un approfondimento alle Intelligenze Artificiali linguistiche in italiano e open source

Tra loro viene riportata anche Cerbero, l'architettura creata da Federico Galatolo, ricercatore al DII in sistemi di elaborazione delle informazioni e Mario Giovanni Cimino, docente di ingegneria informatica al DII.

Cerbero è il primo modello di linguaggio di grandi dimensioni (LLM) italiano distribuito con una licenza open source che ne permette l'uso anche in contesti commerciali.

Questo modello è stato sviluppato per rispondere alla crescente necessità di strumenti avanzati di intelligenza artificiale capaci di comprendere e generare testo in italiano con un alto grado di accuratezza.

Attualmente, Cerbero-7b si posiziona in cima alla classifica degli LLM italiani disponibili, come indicato dalla leaderboard ospitata su Hugging Face.
Questo posizionamento sottolinea la sua capacità di superare altri modelli disponibili sul mercato in termini di performance su specifiche metriche di valutazione. https://huggingface.co/spaces/FinancialSupport/open_ita_llm_leaderboard

Uno degli aspetti distintivi di Cerbero è il metodo innovativo adottato per la generazione del suo dataset. Attraverso l'utilizzo di tecniche avanzate di auto-conversazione e filtraggio, il modello è stato addestrato su un corpus di testo che riflette la diversità e la complessità della lingua italiana.
Questo approccio ha contribuito a migliorare la qualità e l'affidabilità del modello nel comprendere e produrre testo in italiano.

La licenza Apache 2.0 sotto cui viene distribuito Cerbero facilita l'adozione del modello da parte di una vasta gamma di utenti, inclusi sviluppatori, ricercatori e imprese. Questa licenza permissiva incoraggia l'uso, la modifica e la distribuzione del modello, contribuendo alla diffusione delle tecnologie AI nel panorama italiano.

Cerbero rappresenta un'importante risorsa per la comunità AI italiana, offrendo un modello linguistico avanzato che supporta lo sviluppo di applicazioni in grado di interagire efficacemente in italiano. La sua apertura e le sue prestazioni lo rendono uno strumento prezioso per vari ambiti di applicazione, dalla ricerca accademica allo sviluppo di soluzioni commerciali.

La ricerca sull' Intelligenza artificiale per la società del futuro si svolge nel laboratorio FoReLab del Dipartimento, dedicato alle tecnologie per Industria 5.0