Eric Sze-Lang Chan (a.k.a. eepmon) - Intersections 6 - Opendata painting
Approccio agile all’ontologia della Pubblica Amministrazione
di Riccardo Maria Grosso
Il principio che ha guidato l'approccio agile è stato il seguente, semplice ma potente: cerchiamo di arrivare all'ontologia della PA, popolando un foglio bianco con alcuni concetti esistenti a disposizione e facendoli evolvere, senza la pretesa di costruire una cosa complicatissima e quindi di non costruirla mai. Evitiamo quindi di arrivarci con interviste infinite agli esperti di materia, troviamo semmai dei semiautomatismi semplici ma potenti, che riducano gli ordini di grandezza di tempo necessari per arrivarvi.
Per fare questo siamo partiti da una libreria di concetti del professor Carlo Batini, ottenuta dal paziente lavoro di tesisti e borsisti con interviste non approfondite: schemi concettuali integrati, classificati e raggruppati piramidalmente secondo gerarchie di astrazione, modelli entità-relazioni e attributi, metadati descrittivi. Tale libreria inizialmente cartacea è stata digitalizzata.
Avevamo il problema di costruire l'ontologia della pa locale piemontese avendo a disposizione: dal basso gli schemi logico fisici delle basi dati e i loro metadati, dall'alto gli schemi concettuali della pa centrale.
Abbiamo messo a punto una metodologia di inferenza semantica per il marriage top-down (schemi concettuali pacentrale, schemi logico-fisici palocale) e l'ottenimento degli schemi concettuali palocale.
Tale metodologia consta di 5 step fondamentali, funzionali a derivare da uno schema logico-fisico pa locale il suo prototipo di schema concettuale pa locale:
- ricerca entità (funzione principale, ad oggi migliorabile nei criteri di text mining e ricerca semantica): ogni nome entità (quindi ogni concetto) presente negli schemi concettuali pacentrale viene ricercata per somiglianza nei nomi e nelle descrizioni di tavole e campi dei database della pa locale piemontese
- riuso gerarchie di generalizzazione entità presenti nei concettuali pacentrale
- marriage attributi concettuali pacentrale con attributi logico-fisici palocale
- riuso relazioni concettuali pacentrale
- aggiunta relazioni (e quindi nuove entità) di vicinanza tra tabelle logico-fisiche palocale; questa funzionalità permette di incrementare la conoscenza a disposizione, ovvero nuovi concetti che acquistano dignità ed aggiornano i concetti esistenti usati come esca.
Questa metodologia produce dei semilavorati da mettere a disposizione degli esperti di materia, che validano e perfezionano (aggiungendo o togliendo concetti inferiti e non) i prototipi di schemi concettuali palocale ottenibili dalla metodologia e dai tools correlati.
Gli schemi validati ottenuti, da notare, sono concettuali, ma "ancorati" ai database logico-fisici dei quali analizzano i metadati. Tale ancoraggio potrebbe consentire, a fronte di query ontologiche fatte sui modelli concettuali, di mappare e interrogare le basi dati fisiche.
Inoltre la metodologia descritta si presterebbe anche ad altri scopi, ovvero ad essere usata per mettere in relazione concetti nel web.
Non ultima, la generalizzabilità del metodo: a fronte di una libreria di schemi per la pa ottengo schemi e ancoraggi a metadati e dati della pa, se ho a disposizione ad esempio una libreria di schemi automotive, posso inferire schemi e ancorare metadati (siano essi basi dati o più in generale oggetti informatici, web e quant'altro) relativi al settore automotive.