Data Center

Teknologjia OLAP – revolucioni i parë në analizën e të dhënave

Feb 24 2011
0 Shpërndarje
Teknologjia OLAP – revolucioni i parë në analizën e të dhënave

Përpunimi analitik online i të dhënave, apo OLAP, ka luajtur një rol vendimtar si vegël e analistëve për të naviguar të dhënat dimensionale dhe për të identifikuar trendet, anomalitë dhe rrënjët e shkaqeve. OLAP ka në zemër organizmin e të dhënave dimensionale dhe numerike në formë kubi, prandaj shpesh i referohemi si OLAP Cube.

Teknologjia që ngërthen OLAP ka evoluar që nga viti 1990, duke dhënë vizualitet më të madh, manovrim me të dhënat dhe fuqi më të madhe analitike. Por më e mira ende nuk ka ardhur: vizualizimi i perfeksionuar, rritja e mundësive të manovrimit dhe performancat më të mira. Në fakt, cila është detyra e vërtetë e teknologjisë OLAP? Të japësh këtë përgjigje është njësoj si t’i përgjigjesh pyetjes pse i analizojmë të dhënat.

Të dhënat e papërpunuara paraqesin burimin kryesor të informacionit të një kompanie. Ato janë si mihjet e papërpunuara, që në pamje të parë të duken të pavlefshme, por në fakt fshehin brenda thesar. Në fakt, ajo që duhet të bëjmë është të mihim në mihjet tona të papërpunuara ose në gjuhën e teknologjisë informative, të mihim në të dhëna. Në fakt ky është edhe koncepti për të cilin do shkruajmë sot: mihja e te dhënave, që njihet si Data Mining. Analizimi i të dhënave paraqet në njëfarë forme edhe përpunimin e tyre, kështu që nga një grumbull të dhënash të panevojshme ato bëhen faktorët kryesorë të performancës së biznesit. Kjo është edhe përgjigjja e pyetjes se pse i analizojmë të dhënat, kurse përgjigjen e pyetjes së parë do ta keni në çdo resht të këtij shkrimi. Analizimi i të dhënave është shumë specifik dhe i profilizuar për çdo natyrë analize.

Që analiza të jetë më domethënëse, ne i ndajmë të dhënat duke e u bazuar në shiritin kohor, si të dhëna historike, të dhëna momentale dhe të dhëna të së ardhmes. Në fakt, të dhënat e së ardhmes janë të dhëna të kalkuluara dhe për t’i kalkuluar ato duhen bërë analiza predikuese. Dhe kjo në fakt paraqet armën kryesore të analizës së të dhënave. Kjo është ajo që çdo kompani dëshiron të dijë: të ardhmen! Që gjithçka të ketë edhe më shumë kuptim, do të mundohem të bëj një përsiatje kohore në të dhënat që posedon pothuajse çdo kompani moderne. Të dhënat historike që posedon kompania janë një burim shumë i rëndësishëm dhe bazë për analizat numerike nga ku rrjedhin indikatorët e performancës, shifrat kyçe të biznesit, parametrat si dhe gjendja e përgjithshme financiare e kompanisë.

Të dhënat historike zakonisht ruhen në bazën e të dhënave ose Databaza, e rafinuar në formë tabelash që përmbajnë të dhëna numerike dhe referuese. Pra, databaza është një burim shumë stabil i të dhënave, por nuk është ajo që kërkohet për analiza dhe manovrim me të dhënat. Në fakt, modeli relacionar është një model që nuk mund t’u përgjigjet kërkesave të analistëve dhe multimodalitetit të kërkesave të biznesit. Për t’u përgjigjur këtyre pyetjeve, shkencëtarët kërkuan një model të ri, jashtë atij tradicional, sepse ata kërkonin të klasifikonin përmbajtjen e të dhënave.

Kështu lindi ajo që ne sot e njohim si databaza multidimensionale ose thjesht Datawarehouse (magazina e të dhënave), e cila mendohet t’u japë përgjigje të gjitha kërkesave të biznesit dhe të jetë efiçent në performimin e analizave në databaza me përmbajtje gjigante të informacionit. I gjithë dallimi bazohet në ndarjen e të dhënave numerike nga ato jonumerike apo referuese, kështu që të dhënat numerike grumbullohen në tabela të veçanta të quajtura Fakte, kurse të dhënat referuese si koha, vendi, segmentet ekonomike, segmentet e marketingut,,. pikat e biznesit, etj., vendosen në tabela të quajtura Dimensione. Ndarja e tillë ndihmon modelin OLAP që të bëjë përllogaritjet statistikore dhe analitike në mënyrë të shpejtë dhe efikase. Kështu që pyetjes se sa ka qenë shitja në pikën x të biznesit sot e krahasuar me të njëjtën datë të vitit paraprak, vetëm nga shitjet e gjeneruara online (nëpërmjet web-it), ky model mund t’i përgjigjet me lehtësi.

Si arrihet shndërrimi i Databazës në Datawarehouse ose Data Marts?

Në treg ekzistojnë shumë platforma të Business Intelligence (një koncept relativisht i ri që mbulon këto ndryshime në përdorimin e të dhënave kryesisht për biznese), por ndër to do të përmend MS SQL BIDS dhe pjesën e saj të specializuar për ETL, e njohur si SSIS. Kjo është ”arma” që unë përdor për momentin dhe jam relativisht i kënaqur me atë që ofron dhe me lehtësinë e manovrimit me të. Pasi krijohet Datawarehouse, sipas planit dhe kërkesave të biznesit në fjalë, atëherë ajo shtjellohet më tutje në MS SQL BIDS (2k5, 2k8, 2k8 R2) me instancën e quajtur SSAS. Kjo në fakt të jep mundësinë e krijimit të Kubit, i cili është i përbërë nga dimensionet dhe faktet apo vlerat numerike. Kubi gjeometrikisht është objekt tredimensional, por në kuptimin e SSAS ai nuk është i kufizuar në numrin e dimensioneve. Kjo ia rrit vlerat këtij modeli dhe e bën shumë fleksibël nëgjurmimin e informacionit deri në granularitetin e tij.

Pasi të jetë krijuar kubi OLAP, gjithçka do të jetë e lehtë për t’u përdorur dhe çdo kërkesë e biznesit do të marrë formë, sidomos vendimmarrësve në biznes do t’u mbetet vetëm çështja e shijes. Raportet do të jenë të gatshme në çdo kohë dhe me mundësi rifreskimi të vlerave numerike varësisht nga natyra e biznesit (bankat dhe institucionet financiare zakonisht kërkojnë rifreskim deri në sekondë, por disa biznese janë të kënaqur me rifreskim ditor të informacionit). Për raportim efikas, MS SQL BIDS ka instancën e posaçme të njohur si SSRS, por këtu mund të futet edhe MS Office Excel me add-in e ri të njohur si Pivot Table apo PoverPivot si më e perfeksionuar, duke pasur mundësi lidhjeje direkte me kubin OLAP. Për të gjitha këto zgjidhje ekzistojnë teknologji alternative ndaj asaj të përmendur Microsoft, p.sh., Oracle, DB2, IBM, SAS, Informatica, Pentaho etj., kane opsionet e tyre në treg. Varësisht shërbimit, çmimit, opsioneve dhe natyrëssë biznesit tuaj, ju mund të zgjidhni ose edhe të kombinoni teknologjitë e lartpërmendura për të krijuar ndoshta një hibrid që do t’i konvenonte biznesit tuaj.

Çfarë e bën të veçantë teknologjinë OLAP?

Ndërtimi i brendshëm në OLAP respekton rregulla të përpikta të shpërndarjes së kateve dhe dimensioneve dhe niveleve më të ulëta të tyre, si granularitetin dhe anëtarësinë e plotë të çdo dimensioni. Po ashtu anëtarët e çdo dimensioni duhet të respektojnë me përpikmëri relacionet e trashëguara nga burimi i informacionit si dhe hierarkitë e krijuara brenda çdo dimensioni. Kubi OLAP bën llogaritje të automatizuara të shumës, vlerës së fundit, vlerës mesatare gjatë agregimit të anëtareve nga niveli më i ulët i hierarkisë deri tek ai më i larti. P.sh. produkti topa futbolli i shitur në dyqanin x të kompanisë y në nivel të qytetit, që ka edhe dy dyqane të tjera të së njëjtës kompani, akumulohet në nivelin Qytet. Niveli Qytet akumulohet ose agregohet në nivelin Shtet e kështu me radhë. Kjo e bën OLAP shumë funksional dhe efiçent ndaj kërkesave të vendimmarrësve në kompani. Asnjëherë mos nguroni të implementoni një teknologji të tillë në kompaninë apo korporatën tuaj sepse ROI (Kthimi i investimit) është vërtet i lartë për këtë.

Lajmet e fundit>