Tu sei qui

LE13: Sistemi informativi e data management

Docente:
Sandro Fiore

Affiliazione:
Università del Salento

Descrizione del corso:

  1. Sistemi informativi: definizione ed esempi. Sistema informatico e concetto di database. Tipologie di sorgenti dati. Evoluzione storica della “database technology”. Definizione e proprietà di un DBMS. Concetto di data models e classificazione (gerarchico, relazionale, object oriented, reticolare). Primitive di strutturazione per i vari data models.
  2. Sistemi informativi orientati alla gestione di informazioni strutturate. Informazione e dato. Basi di dati relazionali, sistemi OLTP, algebra relazionale (operatori di selezione, proiezione, join, etc.). SQL. Database gerarchici e documenti XML. Esempi.
  3. Cenni su sistemi informativi orientati alla gestione di informazioni non-strutturate. Documenti HTML e confronto tra HTML ed XML.
  4. Sistemi informativi per il supporto alle decisioni (data warehouse). Definizione di datawarehouse, data model multidimensionale, sistemi OLAP, confronto OLTP/OLAP, primitive OLAP (slicing/dicing, roll-up/drill-down, pivoting).
  5. Elementi di progettazione di un sistema informativo. Progettazione di sistemi strutturati sia di tipo gerarchico che relazionale. Modello Entità/Relazioni. DTD per documenti XML.
  6. Data management nei contesti eScience: introduzione e problematiche generali. Gestione dei dati scientifici. Data access e data browsing. Formato NetCDF, librerie a supporto per gli sviluppatori, clients e CDL. Gestione dei metadati. Search & discovery (metadata service). Esempi di standard dei metadati (ISO19115 e ISO19139).
  7. Servizi per il data management. Classificazione di tipo general purpose e domain-based. Concetto di client, server e protocolli di comunicazione. Servizi OPeNDAP, THREDDS, FTP, HTTP.
  8. Tools per il processing, l’analisi e la visualizzazione di dati scientifici. Breve cenno ai tools forniti da UNIDATA per la comunità geoscience.
  9. Esercitazioni con SQL, NetCDF (utilities), OPeNDAP, THREDDS. Comandi linux da terminale. Compilazione dei sorgenti del pacchetto NetCDF C library. Installazione e gestione del container Apache Tomcat per applicazioni web.

Prerequisiti:
Nessuno

Libri di testo di riferimento:
Slides presentate a lezione e dispense aggiuntive fornite dal docente, tratte dai seguenti testi:

  • R. Elmasri and S. Navathe, “Fundamentals of Database Systems”, Sixth Edition, 2010
  • M. Golfarelli, S. Rizzi, “Data Warehouse – Teoria e pratica della progettazione”, McGraw Hill, 2005
  • J. Han, M. Kamber, “Data Mining: Concepts and Techniques”, Morgan Kaufmann Publishers, 2006

Regole del corso:
E’ richiesta la frequenza.
L’esame si svolgerà alla fine del corso in modalità test con domande a risposta aperta.