Qualità dei dati

Esercitazioni SQL: Query semplici e Join in ACCESS

DQ: Angiolina85 weblog - 8 Dicembre, 2008 - 11:23

Poniamo il caso di aver costruito in Access le seguenti tabelle, riguardanti le generalità degli impegati nell’impresa di distribuzione “Mail Boxes” e i dati relativi alla loro busta paga (rispettivamente le tabelle sono Mail boxes e Retribuzione:


mail boxes

  

cognome impegato nome impiegato ID Aloi Jacopo 1 Bianchi Stefano 2 Frattigiani Luigi 3 Miccoli Leonardo 4 Pratesi Riccardo 5 Rossi Michele 6 Salvi Angelo 7 Sermonti Alfonso 8

  


retribuzione

 

  

tipo di contratto retribuzione netta numero ore straordinario ID Full time 1300 2 1 Part time 600 2 2 Part time 600 3 3 Part time 700 3 4 Part time 500 3 5 Full Time 1200 4 6 Full time 1300 4 7 Part time 400 5 8

vogliamo chiedere al sistema, con SQL, di visualizzare solo la colonna dei cognomi degli impiegati presso Mail Boxes, dunque creiamo una semplice query:

SELECT [mail boxes].[cognome impegato]
FROM [mail boxes];

il risultato della nostra query sarà il seguente:


mail boxes Query

  

cognome impegato Aloi Bianchi Frattigiani Miccoli Pratesi Rossi Salvi Sermonti

ora invece vogliamo ottenere delle informazioni da entrambe le tabelle, e per fare ciò costruiremo una Join, ossia un’unione tra le due tabelle. Vogliamo sapere, infatti, quali sono gli impegati che hanno un contratto full time, perciò scriveremo:

SELECT [mail boxes].[cognome impegato], retribuzione.[tipo di contratto]
FROM [mail boxes] INNER JOIN retribuzione ON [mail boxes].ID = retribuzione.[tipo di contratto]
WHERE ((”tipo di contratto”=”full time”));

otterremo il seguente risultato:

mail boxes Query1

ID cognome impiegato tipo di contratto 1 Aloi full time 6 Rossi full time 7 Salvi full time

 

Di fondamentale importanza in un DBMS relazionale è il CAMPO CHIAVE, un codice che accomuna tabelle diverse per agganciare i dati che si ripresentano in esse, al fine di poter creare delle Join.

      

Scopo dei software query di reporting: prodotti software più diffusi e semplici da usare

DQ: Angiolina85 weblog - 8 Dicembre, 2008 - 10:41

Attualmente, come detto nei post precedenti, siamo nell’epoca in cui l’infomazione, anzi la conoscenza, è diventata una risorsa importantissima, fonte di successo e di ricchezza per chi riesca a gestirla in modo opportuno.

E proprio quando parliamo di Business Intelligence, riferendoci ad esempio alle imprese, parliamo proprio dell’insieme dei processi aziendali che consentono di gestire al meglio le informazioni, delle tecnologie che consentono di supportare i processi, dai quali ricaveremo conoscenza.

In questo momento ci soffermiamo sulle tecnologie, più precisamente sui software di reporting che consentono di interrogare i dati che abbiamo a disposizione attraverso le query, e che rappresentano uno strumento indispensabile per le aziende, di tutte le dimensioni, che vogliano interfacciarsi col mercato senza essere impreparate.

Access è uno di questi software, uno dei più semplici; inserito nel pacchetto Office, può essere utilizzato anche da chi non è esperto, o da chi non deve trattare una grande mole di dati. Ciononostante, si mostra utile anche per le imprese che trattano una pesante quantità di dati.

Sas è un altro tool software di facile utilizzo, in quanto basato su criteri quali fruibilità, gestibilità, interoperabilità e scalabilità. La sua facilità d’uso è dovuta alla presenza di menu, barre di accesso veloce, toolbar con funzioni attive e alberi di navigazione. La Business Intelligence viene così estesa a tutti i livelli di utenza, compresa quella non addetta ai lavori. Le interfacce inoltre sono scritte in Java, come anche tutti i report. Adattabile alle piattaforme più diffuse: Microsoft,Unix, Linux, MVS, VMS.

Sw-ing 2007 si mostra come una soluzione semplice, ma affidabile e potente nelle sue funzionalità.

Sw-ing Navigator permette all’utente di navigare tra le informazioni interrogandole con funzioni preimpostate oppure estrapolando i dati creando autonomamente la propria reportistica. Sw-ing Administrator consente di creare e gestire un proprio Datawarehouse, mentre con Sw-ing Publisher si possono pubblicare e distribuire package di documenti di diversi formati sia all’interno che all’esterno dell’azienda. Infine, Sw-ing Connector permette di accedere dall’esterno al DB aziendale, attraverso una normale connessione ad Internet, in tutta sicurezza.

Ma la lista potrebbe continuare: tra i software commerciali troviamo ancora Datasys, Q-DAS, e al top abbiamo microstrategy, Cognos, DataTime e Business Objects. Ma sono presenti sul mercato anche versioni Open Source (DataTime Report Portal ,Greenplum Inc., JPivot, OpenI, Pentaho, Ramsetcube, SpagoBI ,Mondrian, easyDE, JasperReport).

Tutti questi tool di reportistica soddisfano le condizioni di compattezza e sintesi (capacità di ottenere report sintetici e di “joinare” i dati), oltre che la visualizzazione grafica dei risultati attraverso grafici e tabelle

      

Il trattamento delle informazioni nelle grandi aziende. Contributo del Dottor Alessio

DQ: Angiolina85 weblog - 2 Dicembre, 2008 - 12:58

Quando ci riferiamo alla cultura d’impresa oggi, non possiamo riferirci solo alla classe manageriale, a coloro che rivestono un ruolo rilevante, come manager, dirigenti o quadri.

Attualmente nelle aziende la cultura d’impresa pervade l’intero organigramma, determinando così una coerenza interna nei singolo processi e funzioni. Nulla, insomma, deve essere lasciato al caso.

Per far sì che questo avvenga, che la cultura imprenditoriale pervada tutti coloro che ne fanno parte, è necessario che le informazioni circolino: insomma, più che un dovere di informazione, l’impresa deve trasmettere un diritto di informazione ai suoi componenti, per far sì che essi si sentano parte di essa, e condividano le decisioni, sia a monte (partecipando a progetti, incontri in cui si costruiscono dei piani d’azione) che a valle, mettendole in atto.

Solo così l’azienda crea un team compatto, motivato, proattivo verso le iniziative e più pintranetropenso a d accettare anche bruschi cambiamenti.

In passato (ma anche attualmente in alcuni casi), prima della fase di reingegnerizzazzione dei processi ziendali, tutto ciò non accadeva, e la cultura d’impresa aveva un approccio per funzioni, demandate a tre sole figure: pianificazione e controllo, relazioni esterne, trattamento dei dati. Chi aveva questi task possedeva il know what e il know how, il resto degli impiegati erano meri esecutori.

Quello che attualmente accade nelle aziende è che si conosce tutto di tutto e di tutti: l’impresa è e deve essere una famiglia, ed ogni suo componente non può fare a meno dell’altro, perchè la conoscenza garantisce il successo, purchè sia condivisa.

Oggi il nuovo asset delle imprese infatti è proprio la conoscenza e la sua organizzazione e gestione (Knowledge Management).

Se non la si condivide all’interno e all’esterno non si può crescere nel mercato, tantomeno la conoscenza stessa non crescerebbe e non aumenterebbe il suo valore.

Naturalmente le informazioni che un’impresa possiede sono tante, e per gestirle ci serviamo di tools come l’ERP (Enterprise Resource Planning), un sistema informativo in moduli che gestisce informazioni aziendali.

Esso divide i centri di costo riguardo una pianificazione, dai centri di competenze, ossia le funzioni che il planning dovrà coinvolgere. Costituisce, insomma, uno strumento organizativo per gestire progetti, azioni di ogni genere.

Per qunto concerne le competenze all’interno di un progetto, esse saranno suddivise a seconda degli obiettivi da raggiungere, per cui avremo il Progect Manager, che è un supervisore responsabile dell’intera iniziativa, mentre l’Integration Manager è colui al quale viene affidato il raggiungimento di uno degli obiettivi finali.

Questo ai fini di una politica di scorecarding, per cui ssrà possibile misurare la performance e il contributo di ogni Integration Manager nel raggiungere l’obiettivo prefissato nel planning, per poterlo premiare.

La conoscenza è patrimonio di tutti, e come tale deve esserne garantita la circolazione.

Sempre più frequenti sono le Intranet aziendali, che consentono la trasmissione tempestiva ed aggiornata delle informazioni, attraverso pubblicazioni come gli House Horgan, vero e proprio giornale aziendale con news che riguardano i vari dipartimenti, nonchè eventi che coinvolgono direttamente i singoli, come premiazioni, nuove assunzioni, licenziamenti, concorsi interni per accedere a posizioni più alte ecc.

      

Approfondimenti su SQL: clauslole Where, Having, Group By

DQ: Angiolina85 weblog - 2 Dicembre, 2008 - 12:39

Le clausole che Sql contempla sono:

  • Where
  • Group By
  •  Order By
  • Having

La clausola Where verifica che ci siano delle condizioni solo a livello di singole righe. Ecco un esempio, in cui dalla tabella che interroghiamo, poniamo la clausola Where ‘Importo<150000′; tale condizione è stata posta a tutte le righe per poi ottenere solo quelle che la soddisfano:

ASSEGNI

ASSEGNO
——————-

BENEFICIARIO
————————————— IMPORTO
——————- NOTE
————————————— 1 COMPUTER SHOP 50 000 DISCHETTI E CD-ROM 2 LIBRERIE CULTURA 245 000 LIBRI, CANCELLERIA 3 COMPUTER SHOP 200 000 TELEFONO CELLULARE 4 BIOGAS SRL 88 000 GAS 5 SUPERMARCHET GS 150 000 ALIMENTARI 16 ASSICURAZIONI ASSO 425 000 ASSICURAZIONE CASA 17 GAS S.P.A. 25 000 GAS 21 COMPUTER SHOP 34 000 CONTROLLER 20 ABITI BELLA 110 000 PANTALONI 9 ABITI BELLA 224 000 COMPLETO DONNA 8 COMPUTER SHOP 134 000 JOYSTICK

 

SELECT * FROM ASSEGNI
WHERE IMPORTO < 150000;

ASSEGNO
——————-

BENEFICIARIO
————————————— IMPORTO
——————- NOTE
————————————— 1 COMPUTER SHOP 50 000 DISCHETTI E CD-ROM 4 BIOGAS SRL 88 000 GAS 17 GAS S.P.A. 25 000 GAS 21 COMPUTER SHOP 34 000 CONTROLLER 20 ABITI BELLA 110 000 PANTALONI 8 COMPUTER SHOP 134 000 JOYSTICK

La clausola Group By consente di interrogare le colonne di una tabella per formare dei sottoinsiemi.

Ad esempio, se per ogni beneficiario vogliamo sapere quanto è stato elargito, abbiamo la segunete espressione:

SELECT BENEFICIARIO, SUM(IMPORTO)
FROM ASSEGNI
GROUP BY BENEFICIARIO;

Da cui otterremo questo risultato:

BENEFICIARIO
————————————— SUM(IMPORTO)
————————— ABITI BELLA 334 000 ASSICURAZIONI ASSO 425 000 BIOGAS SRL 88 000 COMPUTER SHOP 418 000 GAS S.P.A. 25 000 LIBRERIE CULTURA 245 000 SUPERMARCHET GS 150 000

 

La clausola Having viene utilizzata in sostituzione di Where quando nella condizione appaiono funzioni di gruppo o quando la condizione deve verificarsi per un sottoinsieme di righe.

SELECT DIVISIONE, AVG(STIPENDIO)
FROM DIPENDENTI
GROUP BY DIVISIONE
HAVING DIVISIONE = ‘VENDITE’;

DIVISIONE
——————————- AVG(STIPENDIO)
————————— VENDITE 2033333,3

Qui vediamo che la media degli stipendi è stata estrapolata dalla sola divisione vendite.

      

Ansi SQL

DQ: Angiolina85 weblog - 2 Dicembre, 2008 - 12:13

Un requisito fondamentale dei RDBMS è quello per cui, per creare relazioni, necessiti di un linguaggio standard, comune ai diversi software di reportistica.

Tale standard è appunto l’ANSI SQL, (Structured Query Language della American National Standard Institute).

In realtà l’ANSI SQL si divide in sottolinguaggi tra i più diffusi software Data Base, tra cui Oracle Sql, Transact Sql, Postgre-Sql, My Sql, Sql Informix e DB II Sql.ansi

      

Creazione di Data Source con Data Time, Creazione di Join Arbitrarie mediante strumento visuale di Data Time, Report da tabelle multiple, Datagrid multipli da diversi datasource sullo stesso report Data Time

DQ: Angiolina85 weblog - 1 Dicembre, 2008 - 20:41

createdatanewsource21. Creazione di un Data Source con Data Time.

Per creare un nuovo Data Source, clik su create new Data Source.

Se invece vogliamo creare un report veloce, immediato, scegliamo “quick report”.

 

 

 

Se invece vogliamo importarlo da un’altra fonte, clik su New Data Source

data-source     

 

 

 

 

 

 

 

2. Creazione di join  in data time con strumento visuale.

Data Time fornisce un percorso visuale per creare la join, servendosi del cursore (drag and drop) per simulare una penna che muovendosi tra le tabelle consente la scelta dei campi tra i quali creare join. Se la relazioni sono già esistenti nella nostra fonte, basta cliccare col tasto destro del mouse nell’area delle tabelle e scegliere il comando che ci permette di visualizzare la “mappa della relazione tra gli oggetti”.

joinpath

 

 

 

 

 

 

 

 

 

 

3. Report da tabelle multiple. 

Per creare un report da tabelle multiple, quindi di più Data Source, utilizzeremo il settimo comando tra quelli inziali (tables) per creare tabelle dalle quali estrarremo i nostri report. Si aprirà infatti una finestra dalla quale estrarremo il campo tab-multiple1desiderato. Quindi clik cu “edit manually“ ottenendo così un report custom made. Cliccando infine su query possiamo visualizzare una preview dei risultati.                

4. Creazine di Data Grid multipli da Data Source diversi nello stesso report Data Time.

La finestra Slice and Dice che apriamo quando vogliamo creare una griglia di dati mostra di default le funzioni “dimensioni” (variabili) e ”misure” (funzioni di aggregazione).

Dopo aver selezionato le dimensioni click su “generate” .datagrid

 L’output può essere una griglia verticale o incrociata a seconda di come vogliamo disporrei campi scelti, qualunque essi siano.

 

Se vogliamo proporre il report su un documento html, scegliamo l’opzione “web report“.

      

Introduzione a Data Time Reporting System: un semplice report

DQ: Angiolina85 weblog - 1 Dicembre, 2008 - 19:46

startaquickreportData Time è uno dei tool di reportistica che consente di estrarre da uno o più Data Mart all’interno del Datawarehouse i dati utili per le funzioni ETL (estrazione e operazioni sui dati).

Data Time ha le seguenti peculiarità:

-CONNETTIVITA’  UNIVERSALE ad ogni tipo di DBMS,oltre che la presenza delle regole di ETL con codice SQL 

-semplicità di utilizzo delle funzioni ETL, le cui regole sono scritte in SQL

-PERSONALIZZAZIONE del LAYOUT  grafico del report, le cui impostazioni possono essere salvate ed utilizzate in altre occasioni.

Una volta installato Data Time, sul desktop comparirà un’icona per avviarlo.

E’ ora possibile creare un report del tutto nuovo, oppure caricare sul software un Data Base già esistente, attraverso il comando “Open new project_Connection to a Data Base…”. Naturlamnete il DB  sarà in versione Oracle, My Sql, db2, Access.

Attraverso il comando “Quick report_reload structure” sarà possibile ottenere un report da una lista di tabelle contenute nel DB, senza importarlo interamente.

Ora l’utente potrà creare report con arricchimento di immagini, testo, oltre a tebelle, ad alto livello stilistico, peculiarità di Data Time.

      

Reporting, Elementi statistici, Charting con Data Time

DQ: Angiolina85 weblog - 1 Dicembre, 2008 - 19:32

Data Time offre report web consultabili e diffusi su Internet, compatibii con ogni browser.

Gli OUTPUT che si ottengono con Data Time sono:

  • report ad alto impatto visivo, dove l’utente può controllare tutti gli elementi grafici e stilistici
  • layout verticale, orizzontale o misto
  • operazioni di ogni tipo sul cubo multidimensionale tra cui sezioni verticali ed orizzontali, interruzuoni verticali e orizzontali, drill down-roll up su ogni livello, slice-dice di ogni tipo.

Il report, inoltre, è pubblicato nel web secondo due modalità:

  • updatable: sola consultazione
  • interactive: interattività del report grazie alla possibilità dell’utente di modificarlo attraverso operazioni drill e redesign.

I grafici sono flessibili, come lo dimostra la possibilità di ricostruzione del cubo multidimensionale, ed i chart sono linkabili e rielaborabili dall’utente.

      

Principali tool software di Query Reporting: B.O., Microstrategy, Cognos, Data Time

DQ: Angiolina85 weblog - 1 Dicembre, 2008 - 19:11

I software che tra poco descriveremo sono ai primi posti nella hit parade dei tools per la creazione di query reporting nelle aziende di tutto il mondo, a dimostrazione della loro efficienza ed efficacia nella presa di decisioni importanti. l primo posto abbiamo Microstrategy, seguito da Cognos e B.O. (Business Object).

In coda abbiamo Data Time.

Ma quali sono i loro asset competitivi, le caratteristiche che li rende vincenti e che a loro volta consentono ad un’azienda di esserlo?

MICROSTRATEGY è un software integrato per report, analisi e monitoraggio che consente alle aziende di grande calibro di ottimizzare il processo decisionale. Tecnologia, ricchezza di funzioni e scalabilità sono gli asset vincenti di questo software.

 I vantaggi per le aziende? report con più dati, verso più utenti, connettendosi al web; microstrategy, infatti, è un’applicazione distribuita sul web che permette di ottenere migliori risultati di business rispetto a quelle distribuite mediamnte modalità client/server. L’utenza è diversificata, per la flessibilità del software.

COGNOS è un tool di proprietà IBM, che fornisce funzionalità di Business Intelligence in un’unica soluzione:

  • reporting: definizione di metriche che allineano performance
  • analisi
  • scorecarding: misurazione del contributo della performance, individuale o di gruppo, nel raggiungimento di obiettivi strategici
  • dashboards: applicazione che attiva un tasto delle mini- applicazioni dette widget, per poi farle sparire quando non occorrono più
  • gestione eventi aziendali e integrazione dati

L’ambiente Cognos è semplificato, compatto, in modo da ottimizzare i processi decisionali e allo stesso tempo estenderne la sua implementazione presso ampi bacini di utenza.

Infatti, vi è la versione “consumer” e la versione “B.I.”, a dimostrazione della sua versatilità nel soddisfare in modo impeccabile diverse esigenze.

Business Object è un software apposito per il Business Intelligence, con reportistica evoluta e analisi di dati provenienti da altri Data Base. Business Object è attualmente leader nel mercato Europeo dei tool di Business Intelligence , per via di funzionalità quali core B.I., enterprise information e enterprise performance management.

Data Time, infine,  rappresenta un’altra delle soluzioni di reportisctica più potenti al mondo. Basato su protocollo oleDB, consente la connessione a qualunque DBMS con tale protocollo (My Sql, Oracle, Access, Sql Server, fogli Excel e file di testo limitato). Da ciò ne deriva flessibilità, connettendosi a qualsiasi tipo di macchina oltre che di DBMS.

      

Funzioni ETL e principali tool software di ETL

DQ: Angiolina85 weblog - 1 Dicembre, 2008 - 18:38

In un Datawarehouse che voglia fornire un supporto concreto alle decisioni aziendali, le funzioni di Estrazione, Trasformazione e Caricamento dei dati sono fondamentali.

Un database che non venga interrogato, e non subisca modifiche/integrazioni nel tempo, è indice di scarso interesse dell’azienda nei confronti del suo stesso stato di salute, di isolamento rispetto al mercato di riferimento, di disinteresse verso la realtà che la circonda. Insomma, senza informazioni, un’azienda non può crescere, e per farlo deve necessariamente oggi servirsi di tools che forniscano funzioni ETL.

ma vediamo nel dettaglio come adoperarle in un datawarehouse:

  1. i dati vengono estratti da fonti sorgenti quali OLTP o DB transazionali, file di testo o altri sistemi informatici (ERP o CRM);
  2. nella trasformazione, vi sono operazioni quali la NORMALIZZAZIONE, codifica dei dati, QUERY sui dati di origine da cui deriveranno nuovo report, JOIN  tra tabelle, AGGREGAZIONE di dati. Tutte queste operazioni consentono la SINTESI dei dati provenienti da fonti diverse, a seconda delle esigenze conoscitive dell’azienda;
  3. memorizzazione (LOAD) delle tabelle di sintesi o report in sistemi quali Data Warehouse o DataMart

Tra i tools ETL ne abbiamo alcuni che sono open source, scritti in Java: Octopus, Xineo, Clover ETL…

Tra i fornitori più specializzati di software ETL abbiamo Informatica, Ascential Software, Hummingbird.

Anche Microsoft fornisce ETL nel Data Base SQLServer , come pure Oracle. IBM offre la componente DB2 Information Integration.

      

Google
 
      
Condividi contenuti