Un’idea per valorizzare le 12.223 (e oltre) basi dati pervenute ad AGID.
Una prima cosa che si potrebbe fare, se i files relativi agli elenchi pervenuti vengono messi in una area condivisa, è provare a fare inferenza "as is".
Se ho ben capito, il dettaglio atomico per ora è la base dati, ma per ciascuna vi sono metadati descrittivi utili alle inferenze semantiche.
Voglio dire: se una certa base dati è descritta come "anagrafe dei cittadini", è ben probabile che la si possa taggare e classificare secondo la gerarchia "soggetto is a soggetto fisico is a cittadino". Giusto per fare un esempio.
Per cui se si rendono accessibili tali files, io potrei già produrre qualche semilavorato che spero interessante, usando le ontologie di Batini.
A suo tempo eravamo andati nel dettaglio di tavole e campi, che qualora anche non fossero corredati di metadati, il nome parlante di tavole e campi ci dava indizi più precisi sulle entità implementate.
Inoltre le relazioni fisiche tra le tavole dei db ci fornivano indizi per nuove correlazioni tra entità da far salire a livello concettuale.
Ma prima di arrivare ai dettagli su tavole e campi, che bisognerebbe in un secondo giro chiedere a tutti i 12.223 più altri di fornire, si può già fare del lavoro prezioso.
Notare che la mia idea, più che un tool che sarebbe da ammodernare tecnologicamente, è sostanzialmente un metodo.
Dato un insieme di metadati di un certo contesto, è possibile, con una libreria di schemi concettuali (ontologie leggere) coerente col contesto, fare delle inferenze.
Non necessariamente le ontologie di Batini devono essere le esche da usare nella pesca dei concetti, le ontologie di Batini sono solo un input top-down della metodologia.
Nei mesi scorsi con varie persone, uno fra tutti Marco Brandizi che lavora in UK su questi temi, si è pensato di attingere a librerie ontologiche definite in ambiti quali w3c, semic, e in lavori analoghi svolti in UK, applicare la traduzione in lingua italiana delle entità, e usare le ontologie tradotte come esche da pesca.
Nella coerenza di contesto tra insieme di metadati (input bottom up) e ontologie (input top down) è necessario almeno che i concetti univoci siano declinati per lingua di inferenza.
Questo per quanto riguarda gli aspetti tecnici.
Ripeto: se il materiale dei 12.223 è disponibile, ci potrei già fare qualche lavoretto sopra.