Archeontologie informatiche vecchie e nuove.
Dal 1995 ho il pallino delle ontologie informatiche (http://nelfuturo.com/introduzione-alle-ontologie).
Da allora ho scoperto un mondo che vuol dire soprattutto conoscenza, ma che è anche un'arte.
Arte della conoscenza che deve diventare sempre più open.
Le prime forme di ontologie informatiche di cui mi sono occupato, sono stati i modelli concettuali dei dati, e i dizionari dati.
Archeologia.
Ma anche archeontologia.
Archetipi delle ontologie informatiche, che vediamo intorno a noi sempre di più nella moderna società della conoscenza, basata sui dati: open data, open knowledge, linked open data, big data, metadati.
Dalla mia bio (http://nelfuturo.com/autore/Riccardo-Grosso#):
Nel 1995 in IVECO vengo folgorato sulla via di Damasco: mi affascina la potenza matematica e astrattiva del data modeling concettuale con l’uso dei modelli entità relazione. Oggi si parla di ontologie informatiche. Realizzo un data dictionary con ricerca like nei metadati, idea che riprenderò più avanti.
Grazie all’idea della ricerca like nei metadati, insieme a Carlo Batini metto a punto una metodologia e tools per fare knowledge extraction nei metadati usando ontologie della pubblica amministrazione centrale come esche da pesca nella ricerca concetti.
La mia idea è arrivare a collegare gli asset di un datacenter a partire dal server fisico, risalendo ai database implementati nei server, risalendo ancora alle entità concettuali della pubblica amministrazione. Inoltre il progetto del catalogo metadati, e l’uso di ontologie per correlare dati e metadati, si ripropone come idea applicabile ai linked open data, che si arricchiscono di linked open metadata e ontologie. Ne parlo al recente digital venice del 2014:
http://www.slideshare.net/riccardogrosso/digital-venicergrossoslides4-with-explain
Recentemente AgID inaugura il censimento delle basi dati della pubblica amministrazione. Per ora solo un elenco di 12223 e oltre titoli di basi dati e applicazioni. Ma potenzialmente una miniera di informazioni per fare un serio riuso di conoscenza, se acquisissimo le strutture logiche dei database delle p.a. italiane.
Io mi accontento di proporre un prototipo di data dictionary per AgID:
https://drive.google.com/file/d/0B9eWAzJTqlgUcm9YZ1VCVUZGYUk/view
I miei lavori del passato sono condivisi qua: http://nelfuturo.com/Condivisione-lavori-PA
Un possibile approccio basato sul riuso dei concetti è questo: http://nelfuturo.com/approccio-lego
In tempi più recenti, col prezioso aiuto di Cristiano Longo e Fabio Galgani, ho provato a disegnare i concetti inferiti nei metadati:
http://nelfuturo.com/disegno-di-ontologie-owl
Ho anche azzardato una possibile idea di disegnare ontologie dei servizi:
http://nelfuturo.com/ontologie-dei-servizi-applicativi
A un certo punto ho azzardato anche una analogia con i miei lavori del passato sulle basi dati, con i quali si cercava conoscenza dai metadati delle basi dati (nomi e descrizioni di tavole e campi).
Partendo dal catalogo agid, ho estratto conoscenza da nomi e descrizioni di basi dati e applicativi, qui è riassunto il tutto:
http://nelfuturo.com/estrazione-e-classificazione-della-conoscenza-dai-metadati
Ho anche proposto a qualche università l'idea di questa tesi:
http://nelfuturo.com/proposta-di-tesi-per-repository-strutture-basi-dati-della-PA
Ma i lavori più recenti, e forse i più interessanti, sono quelli che partono dall'idea di mappare le entità trattate dalle pubbliche amministrazioni basandosi sul catalogo agid db e app.
Un caro amico, Marco Brancolini, mi ha aiutato a realizzare questo:
http://nelfuturo.com/un-amico-risponde
Da qui l'idea di rendere pubblico l'archivio IpaEntitiesgeo.
Ipaentitiesgeo è una elaborazione presa dal db delle pa (http://www.indicepa.it/public-services/opendata-read-service.php?dstype=FS&filename=amministrazioni.txt) al quale aggiungo le entità per ogni pa (queste le ottengo dal catalogo agid http://basidati.agid.gov.it/catalogo/download.html facendo delle search like con i miei tools). Come si può vedere usando ipaentitiesgeo, oltre alle coordinate geografiche per ogni ipa, vi è una ultima colonna che si chiama entities, al cui interno vi sono una o più entità separate da un separatore.
E qui interviene l'aiuto di un altro grande amico, Francesco Piero Paolicelli, in arte Piersoft.
Ecco una applicazione da lui realizzata con Telegram, con la quale si può accedere ad alcuni metadati delle pubbliche amministrazioni e le entità che usano o trattano.
Ecco il link al bot: https://telegram.me/geontobot
I prossimi step:
1) produzione del file ipaentitiesgeo con tutte le P.A., oggi ha solo quelle che hanno almeno un match con la ricerca like per entità nei metadati db e app di agid
2) merge di ipaentitiesgeo con i metadati agid db e app
Voglio sottolineare, per i palati più sopraffini, che le entità che uso per le ricerche possono essere arricchite e/o sostituite da altre entità da parte di chi vorrà fornirle e condividerle.
Usare gerarchie di entità, e relazioni, per ricerche like nei metadati, è una semplice tassonomizzazione.
Non c'è la pretesa di arrivare in cima all'Everest delle ontologie modello DOLCE, ma un aiuto, una strada ferrata a cui aggrapparsi per arrivare meglio in cima.
Il prossimo passo potrà essere, una volta mappate le entità nelle P.A. grazie al catalogo agid, affinare la mappatura ottenendo gli schemi delle basi dati dalle P.A.