Større billede
Anvendelsesområde: Data Quality (DQ), standardisering af data og fjernelse af duplikater
QualityStage er et værktøj til at standardisere data som opptræder i forskellige formater, skrivemåder og grader af fejlindtastninger.
En anden central opgave er at fjerne duplikater. Som regel bruges disse to funktioner samtidig.
Ud fra standardiseringsregler (som man også selv kan definedre) kan programmet trække de forskellige bestanddele i et dataelement
ud, og rette disse til i en standardiseret form.
Standardiserede skrivemåder gør, at man senere med større præcision kan sammenstille data fra flere kilder. I tillæg kan man,
ved dobbelte forekomster af poster, kombinere informationen fra de forskellige poster sådan, at det er den bedste information
fra hver post, som overlever:
Adresser er eksempel på et område ud af utallige, hvor QualityStage kan trække præcis information ud af ustrukturerede data,
læs fritekst.
Andre eksempler er arbejdsordrer, varebestillinger, lagre osv.
QualityStage udnytter det faktum, at vi har en vis struktur og orden i sproget, som vi taler og skriver, og at der i de fleste
(arbejds-)processer findes flere mønstre, som til stadighed repeteres.
I QualityStage kan man definere regler for, hvordan man vil tolke disse forskellige mønstre.
Større billede
Trinene i QualityStage-processen
Større billede
QualityStage har kapacitet til at håndtere store og komplekse datamængder hurtigt og effektivt.
Gartner har placeret produktet i lederkvadranten for datakvalitetsværktøjer (april 2006). Det regnes også som det mest fremtidsrettede
produkt, og man fremhæver her specielt egenskaberne knyttet til parsing, harmonisering og avanceret matching.