Saltmätargatan 8A, 113 59 Stockholm

+46 (0) 8 410 55 700 info@middlecon.se

How to: Data Lineage rapporter

I och med Big Data explosionen så har vi fått nya behov av att säkerställa att vårt data är rätt, och aktuellt. Många förknippar detta med Data lineage. Men hur insatt är du i ämnet?

I InfoSphere Information Server 11.5 kan vi ta ut data lineage and business lineage rapporter. Här får du veta mera om skillnaden emellan dem.

 

thefile.gifData lineage rapporter visar förflyttningen av data via ett jobb eller flera jobb. Dessa rapporter kan visa i vilken ordningen som data har ändrats i en körning.

Business lineage rapporter visar en förenklad bild av lineage som belyser omvandlingen och aggregering av data. En rapport som behövs av användare i verksamheten. Business lineage rapporter visar inte jobb och asset specifikationer.

När du kör rapporter visas information i relation till verksamhetens mål. Du ser dem inte som isolerade databastabeller, databaskolumner, jobb eller stages, utan som integrerade delar av processen som extracts, loads, investigates, cleanses, transforms, och skapar rapporter på ditt data. Dina lineage rapporter kan också inkludera virtuella tillgångar, vilka representerar datakällor som inte importerades eller skapats i katalogen, men nås av ett jobb.

På begäran kan lineage rapporter visa påverkade beroenden förutom dataflöden. Påverkade assets har egenskapen att de påverkas av annat än dataflödes processer. Sådana processer innefattar jobb schemaläggning, jobboptimering, och rule invocation. Till exempel kan du använda Balanced optimization processen i IBM® InfoSphere® DataStage® och QualityStage® designer för att analysera ett root jobb och sedan för att skapa ett optimerat jobb som gör samma sak, men med förbättringar i prestanda och resursanvändning.

 

Sammanfattningsvis

Data Lineage rapporter

Data lineage rapporter kan visa olika typer av information.

Flödet av data till eller från en utvald information asset, genom olika stages och stage kolumner, genom ett eller flera jobb, i databaser och business intelligence (BI) rapporter.

Ordningen av aktiviteter inom ett jobb, inklusive databastabeller som jobben skriver till eller läser från.

 

Business Lineage rapporter

Business lineage rapporter visar inte extension mapping dokument eller jobb från IBM InfoSphere Datastage och QualityStage. Data flyter fortfarande genom tillgångar som inte visas i rapporten.

Information Governance Catalog Information Asset Administrator konfigurerar vilka informationstillgångar som visas i business lineagerapporter. Business lineage rapporten visar grafiska och text komponenter för endast source, target och intermediate assets som är konfigurerade att ingå i business lineage rapporten.