Ontologie mappate.
Caro Lettore,
cerco di spiegarti in modo sintetico e chiaro cosa vorrei fare, cerco di non essere troppo logorroico per non annoiarti.
Se non fosse chiaro ovviamente sono qui a spiegarmi il meglio possibile, su tua richiesta.
Tu sai che ho realizzato tools che estraggono conoscenza nei metadati dei db.
Tali tools vanno un po' oltre la search: una volta trovate le entita' per somiglianza, arricchiscono le entita' taggate mettendole in gerarchia di astrazione concettuale, e sfruttando le relazioni tra le entita' delle gerarchie.
I tools originariamente lavorano su un megadataset costituito dalle seguenti colonne:
- nome database
- per ogni database:
- nome tavola
- descrizione tavola
- per ogni tavola:
- nome campo
- descrizione campo
Per ogni database ottengo 3 frammenti di ontologia:
- entity
- generalizations
- relations.
Qualche mese fa, preso dal sacro fuoco dei metadati pubblicati dal catalogo agid (elenchi di basi dati e applicazioni di tutte le ipa italiane, o almeno di 12223 di esse), ho fatto un’ analogia, per far digerire quei metadati ai miei tools.
L'analogia e' qui riportata:
- nome ipa
- per ogni ipa:
- nome database
- descrizione database
- per ogni database:
- nome applicazione
- descrizione applicazione
Per ogni ipa ottengo 3 frammenti di ontologia:
- entity
- generalizations
- relations.
Concentriamoci al momento sulle entity ottenute per ogni ipa.
Io ho un entity file per ogni ipa, e per ciascuna ipa l'entity file mi rivela quali entita' gestisce quell'ipa.
Con un esempio: per il comune di Catania, l'entity file conterra' ad esempio CITTADINO, TRIBUTO, ATTO-NOTORIO.
Ogni ipa e' un luogo.
Tieni presente che io, affascinato dal mondo geografico (openstreetmap e tutto il resto) ne sono pero' completamente digiuno, percio' potrei dire delle castronerie.
Una cosa fantastica sarebbe una roba grafica che, a fronte di un input = nome entita', accenda di rosso con un pallino i luoghi che trattano quella entita'.
Cioe', con un esempio, se scrivo STUDENTE e batto invio, vorrei vedere impallinato di rosso tutte le ipa georeferenziate che trattano l'entita' STUDENTE.
Come gia' detto, ogni ipa avrebbe un entity file contenente all'interno un elenco di entita'.
E' una roba complicata da fare ?
Intanto ti rimando al file compresso contenente le entity di tutte le p.a. censite nel catalogo agid.
I files di testo che vedrai nello zip si chiamano tutti con questo formato:
db-<codice-ipa>-Entity-txt
Nel caso di Catania, a puro titolo di esempio, nel nome ci sara' il codice ipa del comune di Catania.
Molti di essi sono vuoti, il che vuol dire che il tool non e' riuscito a fare inferenze (metadati poco o nulla descritti).
In pratica ogni codice-ipa ha un file di nome db-<codice-ipa>-Entity-txt (ciascun file contiene un elenco di entita').
E poi c'e' la seguente tabella:
Come vedrai, o avrai visto, la tabella amministrazioni ha come prima colonna proprio il codice-ipa, e tra i campi ha l'indirizzo del corrispondente codice-ipa.
Per ora e' tutto, ma sono pronto a rispondere e darti qualsiasi chiarimento.
Grazie mille di cuore! Un abbraccio.