Məlumat kublarının dizaynı. Microsoft Query istifadə edərək OLAP kubunun yaradılması

Bu işin bir hissəsi olaraq aşağıdakı suallara baxılacaq:

  • OLAP kubları nədir?
  • Ölçülər, ölçülər, iyerarxiyalar nədir?
  • OLAP kubları üzərində hansı növ əməliyyatlar yerinə yetirilə bilər?
OLAP kubunun konsepsiyası

OLAP-ın əsas postulatı məlumatların təqdim edilməsində çoxölçülülükdür. OLAP terminologiyasında kub və ya hiperkub anlayışı çoxölçülü diskret məlumat məkanını təsvir etmək üçün istifadə olunur.

kub analitik istifadəçinin məlumatı sorğulaya biləcəyi çoxölçülü məlumat strukturudur. Kublar faktlardan və ölçülərdən yaradılmışdır.

Data- bu, təhlil ediləcək şirkətdəki obyektlər və hadisələr haqqında məlumatlardır. Eyni tipli faktlar tədbirlər formalaşdırır. Ölçü kub hüceyrəsindəki dəyər növüdür.

ölçmələr faktların təhlilinin aparıldığı məlumat elementləridir. Belə elementlərin toplusu ölçüsün atributunu təşkil edir (məsələn, həftənin günləri “vaxt” ölçüsünün atributunu təşkil edə bilər). Ticarət müəssisələrinin biznes təhlili tapşırıqlarında "vaxt", "satış", "məhsullar", "müştərilər", "işçilər", "coğrafi yer" kimi kateqoriyalar çox vaxt ölçmə rolunu oynayır. Ölçülər ən çox istifadəçinin faktiki məlumatları təhlil edə biləcəyi məntiqi kateqoriyalar olan iyerarxik strukturlardır. Hər bir iyerarxiya bir və ya bir neçə səviyyəyə malik ola bilər. Beləliklə, "coğrafi yer" ölçüsünün iyerarxiyasına səviyyələr daxil ola bilər: "ölkə - bölgə - şəhər". Zaman iyerarxiyasında, məsələn, səviyyələrin aşağıdakı ardıcıllığını ayırd etmək olar: Ölçü bir neçə iyerarxiyaya malik ola bilər (bu halda bir ölçünün hər bir iyerarxiyası ölçü cədvəlinin eyni əsas atributuna malik olmalıdır).

Kub bir və ya bir neçə fakt cədvəlindən faktiki məlumatları ehtiva edə bilər və çox vaxt bir neçə ölçüdən ibarətdir. Hər hansı bir xüsusi kub adətən müəyyən bir istiqamətli təhlil mövzusuna malikdir.

Şəkil 1-də müəyyən bir şirkət tərəfindən regionlar üzrə neft məhsullarının satışını təhlil etmək üçün hazırlanmış kub nümunəsi göstərilir. Bu kubun üç ölçüsü (zaman, məhsul və bölgə) və bir ölçü (pulla ifadə olunan satış dəyəri) var. Ölçü dəyərləri kubun müvafiq xanalarında (xanada) saxlanılır. Hər bir xana ölçülərin hər birindən dəst adlanan üzvlər dəsti ilə unikal şəkildə müəyyən edilir. Məsələn, kubun aşağı sol küncündə yerləşən xana (98399$ dəyərini ehtiva edir) tuple ilə verilir [iyul 2005, Uzaq Şərq, Dizel]. Burada 98399 dollar dəyərində 2005-ci ilin iyulunda Uzaq Şərqdə dizel satışının həcmi (pul ifadəsində) göstərilir.

Həmçinin nəzərə alın ki, bəzi xanalarda heç bir dəyər yoxdur: bu xanalar boşdur, çünki fakt cədvəlində onlar üçün məlumatlar yoxdur.

düyü. 1. Müxtəlif bölgələrdə neft məhsullarının satışı haqqında məlumat olan kub

Bu cür kubların yaradılmasının əsas məqsədi faktiki məlumatlardan tələb olunan məlumatları çıxaran sorğuların işlənmə vaxtını minimuma endirməkdir. Bu tapşırığı yerinə yetirmək üçün kublar adətən adlanan əvvəlcədən hesablanmış xülasə məlumatları ehtiva edir birləşmələr(toplamalar). Bunlar. kub faktiki olandan daha böyük məlumat sahəsini əhatə edir - orada məntiqi, hesablanmış nöqtələr var. Ümumi funksiyalar faktiki dəyərlərə əsaslanaraq məntiqi məkanda nöqtə dəyərlərini hesablamağa imkan verir. Ən sadə toplama funksiyaları SUM, MAX, MIN, COUNT-dur. Beləliklə, məsələn, MAX funksiyasından istifadə edərək, nümunədə göstərilən kub üçün, Uzaq Şərqdə dizel satışlarının zirvəsinin nə vaxt baş verdiyini və s.

Çoxölçülü kubların başqa bir spesifik xüsusiyyəti mənşə nöqtəsini təyin etməkdə çətinlikdir. Məsələn, Məhsul və ya Regionlar ölçüsü üçün 0 nöqtəsini necə təyin edirsiniz? Bu problemin həlli ölçüsün bütün elementlərini birləşdirən xüsusi bir atribut təqdim etməkdir. Bu atribut (avtomatik olaraq yaradılan) yalnız bir elementdən ibarətdir - Hamısı ("Hamı"). Cəmlər kimi sadə toplama funksiyaları üçün Hamısı elementi verilmiş ölçüsün faktiki məkanındakı bütün elementlərin dəyərlərinin cəminə ekvivalentdir.

Çoxölçülü məlumat modelində mühüm konsepsiya alt fəza və ya alt kubdur. Subkub, kubun içərisində bəzi çoxölçülü fiqur şəklində olan ümumi kub sahəsinin bir hissəsidir. Kubun çoxölçülü fəzası diskret və məhdud olduğundan, alt kub da diskret və məhduddur.

OLAP kubları üzərində əməliyyatlar

OLAP kubunda aşağıdakı əməliyyatlar yerinə yetirilə bilər:

  • dilim;
  • fırlanma;
  • konsolidasiya;
  • detal.
dilim(Şəkil 2) alt kubun xüsusi halıdır. Bu, bu alt qrupa daxil olmayan bir və ya bir neçə ölçü elementinin vahid dəyərinə uyğun gələn çoxölçülü məlumat massivinin alt çoxluğunun formalaşdırılması prosedurudur. Məsələn, neft məhsullarının satışının yalnız müəyyən bir bölgədə, yəni Uralsda zamanla necə inkişaf etdiyini öyrənmək üçün "Ural" elementində "Mallar" ölçüsünü düzəltmək və müvafiq alt çoxluğu (alt kub) çıxarmaq lazımdır. kub.
  • düyü. 2. OLAP kub dilimi

    Fırlanma(Şəkil 3) - hesabatda və ya göstərilən səhifədə göstərilən ölçmələrin yerini dəyişdirmə əməliyyatı. Məsələn, fırlanma əməliyyatı cədvəlin sətir və sütunlarının dəyişdirilməsini əhatə edə bilər. Bundan əlavə, məlumat kubunun fırlanması qeyri-cədvəl ölçülərini göstərilən səhifədə mövcud olan ölçülərin yerinə və əksinə köçürməkdir.

    Annotasiya: Bu mühazirə OLAP məlumat anbarları üçün məlumat kublarının dizaynının əsaslarını əhatə edir. Nümunə CASE alətindən istifadə edərək məlumat kubunun necə qurulacağını göstərir.

    Mühazirənin məqsədi

    Bu mühazirənin materialını öyrəndikdən sonra biləcəksiniz:

    • data kubu nədədir OLAP məlumat anbarı ;
    • üçün məlumat kubunu necə dizayn etmək olar OLAP məlumat anbarları ;
    • məlumat kub ölçüsü nədir;
    • faktın məlumat kubu ilə necə əlaqəli olduğunu;
    • ölçü atributları nədir;
    • iyerarxiya nədir;
    • data kub metri nədir;

    və öyrənin:

    • qurmaq çoxölçülü qrafiklər ;
    • dizayn sadə çoxölçülü qrafiklər.

    Giriş

    OLAP texnologiyası müstəqil deyil proqram təminatı, Yox proqramlaşdırma dili. Əgər siz OLAP-ı bütün təzahürlərində əhatə etməyə çalışırsınızsa, bu, analitiklərin məlumat əldə etməsini asanlaşdıran proqram məhsullarının əsasını təşkil edən konsepsiyalar, prinsiplər və tələblər toplusudur.

    Analitiklər korporativ məlumatların əsas istehlakçılarıdır. Analitikin vəzifəsi böyük məlumat dəstlərində nümunələri tapmaqdır. Buna görə də, analitik müəyyən bir gündə bir partiyalı qələmlərin alıcı İvanova satıldığına diqqət yetirməyəcək - ona yüzlərlə və minlərlə oxşar hadisələr haqqında məlumat lazımdır. Məlumat anbarındakı tək faktlar, məsələn, mühasib və ya satış şöbəsinin rəhbəri üçün maraqlı ola bilər, onun səlahiyyətləri konkret müqaviləni dəstəkləməkdir. Bir analitik üçün bir rekord kifayət deyil - məsələn, ona bir ay, rüb və ya il üçün bütün satış nöqtələri müqavilələri haqqında məlumat lazım ola bilər. Analitika alıcının VÖEN-i və ya telefon nömrəsi ilə maraqlanmaya bilər - o, onun peşəkar fəaliyyətinin mahiyyətini təşkil edən konkret ədədi məlumatlarla işləyir.

    Mərkəzləşmə və rahat strukturlaşma analitikin ehtiyac duyduğu hər şeydən uzaqdır. Ona məlumatı görmək, vizuallaşdırmaq üçün alət lazımdır. Ənənəvi hesabatlar, hətta vahid məlumat anbarı əsasında qurulur, lakin müəyyən bir çeviklikdən məhrumdur. Məlumatların istənilən görünüşünü əldə etmək üçün onları "bükmək", "genişləndirmək" və ya "yıxmaq" mümkün deyil. Analitik məlumatların nə qədər çox “dilimləri” və “dilimləri” tədqiq edə bilsə, bir o qədər çox ideyaya sahib olur ki, bu da öz növbəsində yoxlama üçün getdikcə daha çox “dilim” tələb edir. Məlumatların araşdırılması üçün belə bir vasitə kimi analitik OLAP-dır.

    OLAP məlumat anbarının zəruri atributu olmasa da, bu məlumat anbarında toplanmış məlumatı təhlil etmək üçün getdikcə daha çox istifadə olunur.

    Əməliyyat məlumatları müxtəlif mənbələrdən toplanır, təmizlənir, inteqrasiya olunur və məlumat anbarına əlavə olunur. Eyni zamanda, onlar müxtəlif hesabat alətlərindən istifadə edərək təhlil üçün artıq mövcuddur. Sonra məlumatlar (tam və ya qismən) OLAP təhlili üçün hazırlanır. Onlar xüsusi OLAP verilənlər bazasına yüklənə və ya əlaqəli məlumat anbarına buraxıla bilər. OLAP-dan istifadənin ən vacib elementi metadata, yəni strukturu, yeri və yeri haqqında məlumatdır məlumat transformasiyası. Onların sayəsində müxtəlif saxlama komponentlərinin effektiv qarşılıqlı əlaqəsi təmin edilir.

    Beləliklə, OLAP, məlumat anbarında toplanmış məlumatların çoxölçülü təhlili üçün alətlər toplusu kimi müəyyən edilə bilər.. Teorik olaraq, OLAP alətləri birbaşa əməliyyat məlumatlarına və ya dəqiq nüsxələri. Bununla belə, bu təhlil üçün uyğun olmayan məlumatların təhlilə məruz qalma riski var.

    Müştəri və serverdə OLAP

    OLAP-ın mərkəzində çoxölçülü məlumatların təhlili dayanır. O, şərti olaraq müştəri və server OLAP alətlərinə bölünə bilən müxtəlif alətlərdən istifadə etməklə istehsal oluna bilər.

    Müştəri tərəfi OLAP alətləri məcmu məlumatları (cəmlər, ortalar, maksimumlar və ya minimumlar) hesablayan və göstərən proqramlardır və məcmu məlumatın özü OLAP alətinin ünvan məkanında keşlənir.

    Mənbə verilənləri masaüstü DBMS-də olarsa, məcmu məlumatlar OLAP alətinin özü tərəfindən hesablanır. Mənbə məlumatlarının mənbəyi server DBMS-dirsə, müştəri OLAP alətlərinin çoxu GROUP BY bəndini ehtiva edən SQL sorğularını serverə göndərir və nəticədə serverdə hesablanmış məcmu məlumatları alır.

    Bir qayda olaraq, OLAP funksionallığı statistik məlumatların emalı alətlərində həyata keçirilir (bu sinif məhsullarından Rusiya bazarı Stat Soft və SPSS məhsullarından geniş istifadə olunur) və bəzi cədvəllərdə. Xüsusilə də Microsoft Excel 2000. Bu məhsulla siz kiçik lokal çoxölçülü OLAP kubunu yarada və fayl kimi saxlaya və onun iki və ya üç ölçülü bölmələrini göstərə bilərsiniz.

    Çox inkişaf vasitələriən sadə OLAP funksionallığını həyata keçirən proqramlar yaratmağa imkan verən siniflər və ya komponentlər kitabxanalarını ehtiva edir (məsələn, Borland Delphi və Borland C++ Builder-də Qərar Cube komponentləri). Bundan əlavə, bir çox şirkət təklif edir nəzarət edir ActiveX və oxşar funksionallığı həyata keçirən digər kitabxanalar.

    Nəzərə alın ki, müştəri OLAP alətləri, bir qayda olaraq, az sayda ölçülərlə (adətən altıdan çox olmamaq tövsiyə olunur) və bu parametrlər üçün kiçik müxtəlif dəyərlərlə istifadə olunur - axırda alınan məcmu məlumatlar uyğun olmalıdır. belə bir alətin ünvan məkanı və onların sayı ölçmələrin sayının artması ilə eksponent olaraq artır. Buna görə də, hətta ən primitiv müştəri OLAP alətləri, bir qayda olaraq, onda çoxölçülü bir kub yaratmaq üçün tələb olunan RAM miqdarının ilkin hesablamasını aparmağa imkan verir.

    Bir çox (lakin hamısı deyil) müştəri tərəfi OLAP alətləri məcmu məlumat keşinin məzmununu fayl kimi saxlamağa imkan verir ki, bu da öz növbəsində onların yenidən hesablanmasının qarşısını alır. Qeyd edək ki, bu imkandan çox vaxt məcmu məlumatları başqa təşkilatlara ötürmək və ya dərc etmək üçün özgəninkiləşdirmək üçün istifadə olunur. Bu cür özgəninkiləşdirilmiş məcmu məlumatların tipik nümunəsi müxtəlif regionlarda və müxtəlif yaş qruplarında rast gəlinmə statistikasıdır. açıq məlumat səhiyyə nazirlikləri tərəfindən dərc edilmişdir müxtəlif ölkələr və Ümumdünya Səhiyyə Təşkilatı. Eyni zamanda, konkret xəstəliklərin halları haqqında məlumat olan ilkin məlumatların özü tibb müəssisələrinin məxfi məlumatlarıdır və heç bir halda sığorta şirkətlərinin əlinə keçməməlidir, nəinki ictimailəşməlidir.

    Bir faylda məcmu məlumatların keşinin saxlanması ideyası, məcmu məlumatların saxlanması və dəyişdirilməsi, habelə onları ehtiva edən yaddaşın saxlanması tərəfindən həyata keçirildiyi server tərəfi OLAP alətlərində daha da inkişaf etdirilmişdir. OLAP server adlanan ayrıca proqram və ya proses. Müştəri proqramları belə çoxölçülü yaddaş tələb edə və cavab olaraq bəzi məlumatları qəbul edə bilər. Bəzi müştəri proqramları da bu cür mağazalar yarada və ya dəyişdirilmiş mənbə məlumatlarına uyğun olaraq onları yeniləyə bilər.

    Müştəri OLAP alətləri ilə müqayisədə server OLAP alətlərindən istifadənin üstünlükləri masa üstü olanlarla müqayisədə server DBMS-dən istifadənin üstünlüklərinə bənzəyir: server alətlərindən istifadə edildikdə, məcmu məlumatların hesablanması və saxlanması serverdə baş verir və müştəri tətbiqi. onlara yalnız sorğuların nəticələrini alır ki, bu da ümumiyyətlə şəbəkə trafikini azaltmağa imkan verir, rəhbərlik vaxtı müştəri tətbiqi tərəfindən istehlak edilən sorğular və resurs tələbləri. Nəzərə alın ki, müəssisə miqyaslı təhlil və məlumatların emalı, bir qayda olaraq, dəqiq server OLAP alətlərinə əsaslanır, məsələn, Oracle Express Server, Microsoft SQL Server 2000 Analysis Services, Hyperion Essbase, Crystal Decisions, Business Objects, Cognos məhsulları , S.A.S İnstitutu. Server DBMS-nin bütün aparıcı istehsalçıları müəyyən server OLAP alətləri istehsal etdiklərindən (və ya digər şirkətlərdən lisenziya aldıqları üçün) onların seçimi kifayət qədər genişdir və demək olar ki, bütün hallarda verilənlər bazası serverinin özü ilə eyni istehsalçıdan OLAP server ala bilərsiniz.

    Nəzərə alın ki, bir çox müştəri OLAP alətləri (xüsusilə, Microsoft Excel 2003, Seagate Analysis və s.) bu halda belə sorğuları yerinə yetirən müştəri proqramları kimi çıxış edərək server OLAP yaddaşlarına daxil olmağa imkan verir. Bundan əlavə, müxtəlif istehsalçıların OLAP alətləri üçün müştəri tətbiqləri olan bir çox məhsul var.

    Çoxölçülü məlumatların saxlanmasının texniki aspektləri

    Çoxölçülü məlumat anbarları müxtəlif dərəcəli təfərrüatlı məcmu məlumatları ehtiva edir, məsələn, gün, ay, il, məhsul kateqoriyası üzrə satış həcmi və s. Ümumi məlumatların saxlanmasının məqsədi azaltmaqdır rəhbərlik vaxtı sorğular, çünki əksər hallarda təhlil və proqnozlar üçün maraqlı olan detallı deyil, xülasə məlumatlarıdır. Buna görə də, çoxölçülü verilənlər bazası yaratarkən, bəzi məcmu məlumatlar həmişə hesablanır və saxlanılır.

    Qeyd edək ki, bütün məcmu məlumatların saxlanması həmişə əsaslandırılmır. Fakt budur ki, yeni ölçülər əlavə edildikdə, kubu təşkil edən məlumatların miqdarı eksponent olaraq artır (bəzən məlumatların miqdarının "partlayıcı artımı" haqqında danışırlar). Daha konkret desək, məcmu məlumat artımının miqdarı kubdakı ölçülərin sayından və bu ölçülərin iyerarxiyalarının müxtəlif səviyyələrindəki ölçü üzvlərindən asılıdır. "Partlayıcı artım" problemini həll etmək üçün bütün mümkün məcmu məlumatlardan uzaq hesablama apararkən sorğunun məqbul icra sürətinə nail olmağa imkan verən müxtəlif sxemlərdən istifadə olunur.

    Həm mənbə, həm də məcmu məlumatlar ya əlaqəli və ya çoxölçülü strukturlarda saxlanıla bilər. Buna görə də, hazırda məlumatların saxlanmasının üç yolu var.

    • MOLAP(Çoxölçülü OLAP) - mənbə və məcmu məlumatlar çoxölçülü verilənlər bazasında saxlanılır. Çoxölçülü strukturlarda məlumatların saxlanması məlumatı çoxölçülü massiv kimi manipulyasiya etməyə imkan verir ki, məcmu dəyərlərin hesablanması sürəti istənilən ölçü üçün eyni olsun. Lakin bu halda çoxölçülü verilənlər bazası lazımsızdır, çünki çoxölçülü verilənlər tamamilə orijinal relyasiya məlumatlarını ehtiva edir.
    • ROLAP(Relational OLAP) - İlkin məlumatlar ilkin olaraq yerləşdiyi eyni əlaqəli verilənlər bazasında qalır. Ümumi məlumatlar eyni verilənlər bazasında saxlanması üçün xüsusi olaraq yaradılmış xidmət cədvəllərində yerləşdirilir.
    • HOLAP(Hybrid OLAP) - İlkin verilənlər ilkin yerləşdiyi relational verilənlər bazasında qalır, məcmu məlumatlar isə çoxölçülü verilənlər bazasında saxlanılır.

    Bəzi OLAP alətləri məlumatların saxlanmasını yalnız əlaqəli strukturlarda, bəziləri isə yalnız çoxölçülü olanlarda dəstəkləyir. Bununla belə, əksər müasir OLAP server alətləri hər üç məlumat saxlama üsulunu dəstəkləyir. Saxlama metodunun seçimi mənbə məlumatlarının həcmindən və strukturundan, sorğunun icra sürətinə olan tələblərdən və OLAP kublarının yenilənməsi tezliyindən asılıdır.

    Müasir OLAP alətlərinin böyük əksəriyyətinin "boş" dəyərləri saxlamadığını da qeyd edirik ("boş" dəyərə misal olaraq mövsümdən kənar mövsümi malların satışının olmaması ola bilər).

    Əsas OLAP Konsepsiyaları

    FAMSI testi

    Mürəkkəb çoxölçülü verilənlərin təhlili texnologiyası OLAP (On-Line Analytical Processing) adlanır. OLAP məlumat anbarı təşkilatının əsas komponentidir. OLAP konsepsiyası 1993-cü ildə tanınmış verilənlər bazası tədqiqatçısı və əlaqəli verilənlər modelinin müəllifi Edqar Kodd tərəfindən təsvir edilmişdir. 1995-ci ildə Codd tərəfindən qoyulan tələblərə əsaslanaraq, sözdə FASMI testi(Paylaşılan Çoxölçülü Məlumatın Sürətli Təhlili) - çoxölçülü analiz üçün tətbiqlər üçün aşağıdakı tələblər daxil olmaqla, paylaşılan çoxölçülü məlumatın sürətli təhlili:

    • Sürətli(Sürətli) - istifadəçiyə daha az təfərrüatlı təhlil bahasına olsa belə, ağlabatan müddətdə (adətən 5 saniyədən çox olmayan) analiz nəticələrinin təqdim edilməsi;
    • Təhlil(Analiz) - verilmiş proqrama xas olan hər hansı məntiqi və statistik təhlili aparmaq və onu son istifadəçi üçün əlçatan formada saxlamaq imkanı;
    • paylaşdı(Paylaşılan) - müvafiq kilidləmə mexanizmləri və səlahiyyətli giriş alətləri dəstəyi ilə məlumatlara çox istifadəçi girişi;
    • Çoxölçülü(Çoxölçülü) - Verilənlərin çoxölçülü konseptual təqdimatı, o cümlədən iyerarxiyalar və çoxsaylı iyerarxiyalar üçün tam dəstək (bu, əsas OLAP tələbidir);
    • məlumat(Məlumat) - proqram həcmindən və saxlanma yerindən asılı olmayaraq istənilən zəruri məlumatı əldə etmək imkanına malik olmalıdır.

    Qeyd etmək lazımdır ki, OLAP funksionallığı ofis proqramlarında ən sadə verilənlərin təhlili alətlərindən tutmuş server məhsulları əsasında paylanmış analitik sistemlərə qədər müxtəlif üsullarla həyata keçirilə bilər.

    İnformasiyanın çoxölçülü təqdimatı

    Kuba

    OLAP biznes məlumatlarına daxil olmaq, onlara baxmaq və təhlil etmək üçün rahat, yüksək sürətli vasitələr təqdim edir. İstifadəçi təbii, intuitiv olur məlumat modeli, onları çoxölçülü kublar şəklində təşkil edir (Kublar). Çoxölçülü koordinat sisteminin oxları təhlil edilən biznes prosesinin əsas atributlarıdır. Məsələn, satış üçün bir məhsul, bölgə, alıcı növü ola bilər. Ölçmələrdən biri kimi vaxtdan istifadə edilir. Ölçmə oxlarının kəsişmə nöqtələrində (Ölçülər) prosesi kəmiyyətcə xarakterizə edən məlumatlar - ölçülər (Tədbirlər) var. Bunlar hissə-hissə və ya pul ifadəsində satış həcmləri, səhm qalıqları, xərclər və s. ola bilər. Məlumatı təhlil edən istifadəçi kubu müxtəlif istiqamətlərdə “kəsdirə”, xülasə (məsələn, illər üzrə) və ya əksinə ətraflı (həftəlik) əldə edə bilər. məlumat və təhlil prosesində onun ağlına gələn digər manipulyasiyalar həyata keçirir.

    Şəkildə göstərilən üç ölçülü kubda ölçülər kimi. 26.1-də satış məbləğlərindən istifadə edilir, ölçü kimi isə vaxt, məhsul və mağaza istifadə olunur. Ölçmələr üzərində göstərilir müəyyən səviyyələr qruplaşmalar: mallar kateqoriyalar, mağazalar ölkələr üzrə, əməliyyatların vaxtı haqqında məlumatlar isə aylar üzrə qruplaşdırılır. Bir az sonra qruplaşdırma səviyyələrinə (iyerarxiyalara) daha ətraflı baxacağıq.


    düyü. 26.1.

    Kubun "kəsilməsi"

    Hətta üç ölçülü bir kubu kompüter ekranında göstərmək çətindir ki, maraq ölçülərinin dəyərləri görünə bilsin. Üçdən çox ölçüsü olan kublar haqqında nə deyə bilərik. Bir kubda saxlanılan məlumatları vizuallaşdırmaq üçün, bir qayda olaraq, mürəkkəb iyerarxik sıra və sütun başlıqlarına malik olan adi iki ölçülü, yəni cədvəlli təsvirlərdən istifadə olunur.

    Bir kubun iki ölçülü təsviri onu bir və ya daha çox ox (ölçülər) boyunca "kəsməklə" əldə edilə bilər: ikidən başqa bütün ölçülərin dəyərlərini düzəldirik və müntəzəm iki ölçülü alırıq. masa. Cədvəlin üfüqi oxu (sütun başlıqları) bir ölçüsü, şaquli ox (sətir başlıqları) digər ölçüsü, cədvəl hüceyrələri isə ölçü dəyərlərini təmsil edir. Bu halda, tədbirlər toplusu əslində ölçülərdən biri hesab olunur: biz ya göstərmək üçün bir ölçü seçirik (sonra sətir və sütunların başlıqlarına iki ölçü yerləşdirə bilərik) və ya bir neçə ölçü göstəririk (sonra bir Cədvəlin oxları ölçülərin adları ilə, digəri isə tək "kəsilməmiş" ölçüsün dəyərləri ilə tutulacaq).

    (səviyyələr). Məsələn, təqdim olunan etiketlər bütün OLAP alətləri tərəfindən dəstəklənmir. Məsələn, hər iki iyerarxiya növü Microsoft Analysis Services 2000-də, Microsoft OLAP Services 7.0-da isə yalnız balanslaşdırılmış olanlar dəstəklənir. Fərqli OLAP alətlərində iyerarxiya səviyyələrinin sayı, bir səviyyənin üzvlərinin icazə verilən maksimum sayı və ölçülərin maksimum mümkün sayı ola bilər.

    OLAP Tətbiq Memarlığı

    OLAP haqqında yuxarıda deyilənlərin hamısı, əslində, məlumatların çoxölçülü təqdimatına istinad edirdi. Təxminən desək, nə son istifadəçi, nə də müştərinin istifadə etdiyi alətin tərtibatçıları məlumatların necə saxlandığına əhəmiyyət vermirlər.

    OLAP proqramlarında çoxölçülülük üç səviyyəyə bölünə bilər.

    • Çoxölçülü məlumatların təqdimatı - çoxölçülü vizuallaşdırma və məlumatların manipulyasiyasını təmin edən son istifadəçi alətləri; çoxölçülü təmsil qatı verilənlərin fiziki strukturundan mücərrədləşdirir və verilənlərə çoxölçülü kimi yanaşır.
    • Çoxölçülü emal - çoxölçülü sorğuların formalaşdırılması üçün alət (dil) (ənənəvi relational SQL dili burada uyğun deyil) və belə bir sorğunu emal edib icra edə bilən prosessor.
    • Çoxölçülü saxlama - çoxölçülü sorğuların səmərəli icrasını təmin edən verilənlərin fiziki təşkili vasitələri.

    İlk iki səviyyə bütün OLAP alətlərində məcburidir. Üçüncü səviyyə, geniş istifadə olunsa da, tələb olunmur, çünki çoxölçülü təqdimat üçün məlumatlar adi əlaqə strukturlarından da götürülə bilər; çoxölçülü sorğu prosessoru bu halda çoxölçülü sorğuları əlaqəli DBMS tərəfindən yerinə yetirilən SQL sorğularına çevirir.

    Xüsusi OLAP məhsulları adətən ya çoxölçülü məlumat təqdimetmə vasitəsidir (OLAP müştərisi - məsələn, Microsoft-dan Excel 2000-də Pivot Cədvəllər və ya Knosys-dən ProClarity) və ya çoxölçülü arxa uç DBMS (OLAP server - məsələn, Oracle Express Server və ya Microsoft OLAP) Xidmətlər).

    Çoxölçülü emal təbəqəsi adətən OLAP müştəri və/və ya OLAP serverində qurulur, lakin Microsoft-un Pivot Table Service komponenti kimi ən təmiz formada təcrid oluna bilər.

    / Kubist tərzdə. Böyük şirkətlərin idarəetmə təcrübəsində OLAP kublarının istifadəsi


    ilə təmasda

    Sinif yoldaşları

    Konstantin Tokmaçev, sistem memarı

    kubist şəkildə.
    Böyük şirkətlərin idarəetmə təcrübəsində OLAP kublarının istifadəsi

    Bəlkə də korporasiyanın hesablama resurslarının yalnız məlumatların və mühasibat hesabatlarının qeydiyyatına xərcləndiyi vaxt artıq keçib. Eyni zamanda idarə qərarları ofislərdə, iclas və iclaslarda “gözlə” qəbul edilirdi. Bəlkə də Rusiyada korporativ hesablama sistemlərinə onların əsas resursuna - kompüterdə qeydə alınan məlumatlar əsasında idarəetmə problemlərinin həllinə qayıtmağın vaxtı çatıb.

    Biznes zəkasının faydaları haqqında

    Korporativ idarəetmə dövrəsində, "xam" məlumatlar ilə idarə olunan obyektə təsir edən "qollar" arasında "performans göstəriciləri" - KPI-lər var. Onlar idarə olunan obyektin müxtəlif alt sistemlərinin vəziyyətini əks etdirən, sanki, bir "iş paneli" təşkil edirlər. Şirkəti informativ fəaliyyət göstəriciləri ilə təchiz etmək və onların hesablanmasına və əldə edilən dəyərlərə nəzarət etmək biznes analitikinin işidir. MS SQL Server Analysis Services (SSAS) yardım proqramı və onun əsas dispozitivi olan OLAP kubu kimi avtomatlaşdırılmış analiz xidmətləri korporasiyanın analitik işinin təşkilində əhəmiyyətli köməklik göstərə bilər.

    Burada daha bir qeyd etmək lazımdır. Məsələn, Amerika ənənəsində OLAP kubları ilə işləməyə yönəlmiş ixtisas BI (Business Intelligence) adlanır. Amerika BI-nin rus “biznes analitiki”nə uyğun olması ilə bağlı illüziyalar olmamalıdır. Təəssüf ki, bizim biznes analitikimiz çox vaxt “mühasib” və “az proqramçı”, qeyri-səlis biliyə və az maaşa malik mütəxəssisdir, əslində heç bir aləti və metodologiyası yoxdur.

    BI mütəxəssisi əslində tətbiqi riyaziyyatçıdır, müasir riyazi metodları firmalarla xidmətə qoyan yüksək səviyyəli mütəxəssisdir (əməliyyat tədqiqatı adlanırdı - əməliyyatların tədqiqi metodları). BI daha çox SSRİ-də mövcud olan və Moskva Dövlət Universitetinin VMK-nın fakültəsi tərəfindən istehsal olunan “sistem analitiki” ixtisasına uyğundur. M.V. Lomonosov. OLAP kubu və analiz xidmətləri, bəlkə də Amerika BI-a qarşı ixtisaslarının bir qədər yaxşılaşdırılmasından sonra rus biznes analitikinin iş yeri üçün perspektivli əsas ola bilər.

    Son zamanlar daha bir zərərli tendensiya yaranıb. İxtisaslaşma sayəsində korporasiyanın müxtəlif kateqoriyalı işçiləri arasında qarşılıqlı anlaşma itirdi. İ.A.-nın nağılındakı “qu quşu, xərçəng və pike” kimi mühasib, menecer və proqramçı. Krylov, korporasiyanı müxtəlif istiqamətlərə çəkir.

    Mühasib hesabat verməklə məşğuldur, onun məbləğləri həm məna, həm də dinamika baxımından şirkətin iş prosesi ilə birbaşa əlaqəli deyil.

    Menecer biznes prosesinin öz seqmenti ilə məşğuldur, lakin qlobal miqyasda, bütövlükdə şirkət səviyyəsində öz hərəkətlərinin nəticələrini və perspektivlərini qiymətləndirə bilmir.

    Nəhayət, bir vaxtlar (təhsil sayəsində) elm sahəsindən biznes sahəsinə qədər qabaqcıl texniki ideyaların dirijoru olan proqramçı mühasib və menecer fantaziyalarının passiv icraçısına çevrildiyi üçün artıq nadir hallarda mühasiblər və ümumiyyətlə tənbəl olmayan hər kəs. Təcrübəsiz, savadsız, lakin nisbətən yüksək maaşlı 1C proqramçısı Rusiya korporasiyalarının əsl bəlasıdır. (Az qala yerli futbolçu kimi.) Mən “iqtisadçılar və hüquqşünaslar” deyilənləri demirəm, onlar haqqında çoxdan hər şey deyilir.

    Beləliklə, yüksək texnologiyalı SSAS aparatı ilə təchiz edilmiş, proqramlaşdırma və mühasibat uçotunun əsaslarını bilən biznes analitikinin mövqeyi biznes prosesinin təhlili və proqnozlaşdırılması ilə əlaqədar şirkətin işini birləşdirməyə qadirdir.

    OLAP kublarının üstünlükləri

    OLAP-cube korporativ kompüter sisteminin məlumat bazasını təhlil etmək üçün müasir bir vasitədir və bu, iyerarxiyanın bütün səviyyələrində olan işçiləri şirkətin istehsal prosesini xarakterizə edən tələb olunan göstəricilər dəsti ilə təmin etməyə imkan verir. Məsələ təkcə ondan ibarətdir ki, MDX (Çoxölçülü ifadələr) kubu üçün istifadəçi dostu interfeysi və çevik sorğu dili sizə lazımi analitik göstəriciləri formalaşdırmağa və hesablamağa imkan verir, həm də bu OLAP kubunun bunu həyata keçirməsinin diqqətəlayiq sürəti və asanlığıdır. Üstəlik, bu sürət və asanlıq, müəyyən məhdudiyyətlər daxilində, hesablamaların mürəkkəbliyindən və verilənlər bazasının həcmindən asılı deyil.

    OLAP haqqında bəzi anlayışlar
    kub bir "pivot masa" MS Excel verə bilər. Bu obyektlərin oxşar məntiqi və oxşar interfeysləri var. Ancaq məqalədən göründüyü kimi, OLAP-ın funksionallığı müqayisə olunmayacaq dərəcədə zəngindir və performansı müqayisə olunmayacaq dərəcədə yüksəkdir, belə ki, "pivot masa" yerli masaüstü məhsul olaraq qalır, OLAP isə müəssisə səviyyəsində məhsuldur.

    Niyə OLAP kubu analitik problemlərin həlli üçün bu qədər uyğundur? OLAP kubu elə qurulmuşdur ki, bütün mümkün bölmələrdə bütün göstəricilər əvvəlcədən hesablanır (tam və ya qismən) və istifadəçi yalnız tələb olunan göstəriciləri (ölçü ölçülərini) və bölmələri (ölçü ölçüləri) “çıxarmalıdır”. ) siçan ilə və proqram boşqabları yenidən çəkir.

    Bütün bölmələrdə mümkün olan bütün analitiklər bir nəhəng sahəni, daha doğrusu, sahəni deyil, sadəcə çoxölçülü OLAP kubunu təşkil edir. İstifadəçinin (menecer, biznes analitiki, menecer) analitika xidmətinə etdiyi hər hansı sorğudan asılı olmayaraq, cavab sürəti iki şeyə bağlıdır: birincisi, tələb olunan analitika asanlıqla formalaşdırıla bilər (ya siyahıdan adla seçilir, ya da düsturla verilir) MDX dilində ), ikincisi, bir qayda olaraq, artıq hesablanmışdır.

    Analitikanın formalaşdırılması üç versiyada mümkündür: ya verilənlər bazası sahəsidir (daha doğrusu, anbar sahəsi), ya da kub dizaynı səviyyəsində müəyyən edilmiş hesablama sahəsi və ya kub ilə interaktiv işləyərkən MDX dil ifadəsi.

    Bu, eyni anda OLAP kublarının bir neçə cəlbedici xüsusiyyətləri deməkdir. Əslində, istifadəçi ilə məlumat arasındakı maneə aradan qalxır. Əvvəla, problemi izah etməli (tapşırıq təyin edən) bir tətbiq proqramçısı şəklində bir maneə. İkincisi, proqramçı alqoritmi yaratana, proqramı yazıb sazlayana qədər gözləməli olacaqsınız, sonra o, dəyişdirilə bilər. Əgər çoxlu işçilər varsa və onların tələbləri müxtəlif və dəyişkəndirsə, onda tətbiqi proqramçılardan ibarət bütöv bir komanda lazımdır. Bu mənada OLAP kubu (və ixtisaslı biznes analitiki) analitik iş baxımından bütöv bir tətbiq proqramçıları komandasını əvəz edir, necə ki, xəndək qazarkən ekskavatorla işləyən güclü ekskavator bütün qonaq işçilər briqadasını kürəklərlə əvəz edir!

    Bu zaman əldə edilən analitik məlumatların digər çox mühüm keyfiyyətinə nail olunur. OLAP kubu bütün şirkət üçün bir olduğundan, yəni. Bu, hamı üçün analitiklərlə eyni sahə olduğundan, məlumatlarda zəhlətökən uyğunsuzluq istisna olunur. Bir menecer subyektivlik faktorunu aradan qaldırmaq üçün bir neçə müstəqil işçiyə eyni vəzifə qoymalı olduqda, lakin yenə də hər kəsin bir şəkildə izah etməyi öhdəsinə götürdüyü fərqli cavablar gətirir və s. OLAP kubu korporativ iyerarxiyanın müxtəlif səviyyələrində analitik məlumatların vahidliyini təmin edir, yəni. menecer onu maraqlandıran müəyyən bir göstəricini təfərrüatlandırmaq istəsə, o, şübhəsiz ki, tabeçiliyinin işlədiyi aşağı səviyyəli məlumatlara gələcək və bu, yalnız yüksək səviyyəli göstəricinin hesablandığı məlumatlar olacaqdır. , və bəzi başqa məlumatlar deyil, başqa şəkildə, başqa bir zamanda və s. Yəni, bütün şirkət eyni analitikanı görür, lakin müxtəlif konsolidasiya səviyyələrində.

    Bir nümunə götürək. Tutaq ki, menecer debitor borclarına nəzarət edir. Nə qədər ki, vaxtı keçmiş debitor borclarının KPI-si yaşıl rəngdədir, o zaman hər şey normaldır, heç bir idarəetmə hərəkəti tələb olunmur. Rəng sarı və ya qırmızıya dəyişibsə, bir şey səhvdir: satış şöbəsi tərəfindən KPI-ni kəsdik və dərhal bölmələri "qırmızı" ilə görürük. Növbəti bölmə menecerlər - və müştəriləri ödənişləri gecikdirən satıcılar müəyyən edilir. (Daha sonra gecikmənin məbləği alıcılar, şərtlər və s. üzrə bölünə bilər.) Korporasiya rəhbəri istənilən səviyyədə qanunu pozanlara birbaşa müraciət edə bilər. Ancaq ümumilikdə eyni KPI (iyerarxiya səviyyələrində) həm şöbə müdirləri, həm də satış menecerləri tərəfindən görülür. Buna görə də, vəziyyəti düzəltmək üçün "xalçada zəng" gözləməyə belə ehtiyac yoxdur ... Əlbəttə ki, KPI-nin özü mütləq qanun pozuntusunun məbləği olmamalıdır - bu, orta çəkili ola bilər. gecikmə müddəti və ya ümumiyyətlə, debitor borclarının dövriyyəsi dərəcəsi.

    Qeyd edək ki, MDX dilinin mürəkkəbliyi və çevikliyi sürətli (bəzən ani) nəticələrlə birlikdə başqa şərtlərdə qarşıya qoyula bilməyən mürəkkəb idarəetmə tapşırıqlarını (inkişaf və sazlama mərhələlərini nəzərə alaraq) həll etməyə imkan verir. ümumiyyətlə tətbiqi proqramçılar üçün mürəkkəbliyə və tərtibatda ilkin qeyri-müəyyənliyə görə. (Praktikada tez-tez şərtlərin dəyişməsi zamanı zəif başa düşülən tərtibat və uzun proqram dəyişiklikləri səbəbindən tətbiq proqramçıları üçün analitik problemləri həll etmək üçün uzun müddətlər.)

    Bir məsələyə də diqqət yetirək ki, şirkətin hər bir işçisi ümumi sahədən OLAP analitikinə tam olaraq iş üçün lazım olan məhsulu toplaya bilsin, kommunal “standart hesabatlarda” kəsdiyi “zolaq”la kifayətlənməsin. ”.

    Müştəri-server rejimində OLAP kubu ilə işləmək üçün çox istifadəçi interfeysi hər bir işçiyə başqalarından asılı olmayaraq öz (hətta müəyyən bacarıqlarla öz istehsalı) analitik bloklarına (hesabatlarına) malik olmağa imkan verir ki, onlar müəyyən edildikdən sonra avtomatik yenilənir - başqa sözlə, onlar həmişə aktual vəziyyətdədirlər.

    Yəni, OLAP kubu sizə analitik işi (əslində təkcə qeyd analitikləri tərəfindən deyil, əslində şirkətin demək olar ki, bütün işçiləri, hətta balanslara və daşımalara nəzarət edən logistik və menecerlər tərəfindən həyata keçirilir) daha seçici etməyə imkan verir. üzdən ümumi ifadədə deyil” , bu da işin yaxşılaşdırılmasına və məhsuldarlığın artırılmasına şərait yaradır.

    Girişimizi yekunlaşdıraraq qeyd edirik ki, OLAP kublarının istifadəsi şirkətin idarəçiliyini daha çox yüksəldə bilər. yüksək səviyyə. İyerarxiyanın bütün səviyyələrində analitik məlumatların vahidliyi, onların etibarlılığı, mürəkkəbliyi, göstəricilərin yaradılması və dəyişdirilməsinin asanlığı, fərdi parametrlər, məlumatların işlənməsinin yüksək sürəti və nəhayət, alternativ analitik yolların (tətbiq proqramçıları, müstəqil) dəstəklənməsinə sərf olunan pula və vaxta qənaət. bir işçinin hesablamaları), böyük rus şirkətlərinin təcrübəsində OLAP kublarının istifadəsi üçün açıq perspektivlər.

    OLTP + OLAP: korporativ idarəetmə zəncirində əks əlaqə

    İndi OLAP kublarının ümumi ideyasını və onların korporativ idarəetmə zəncirində tətbiq nöqtəsini nəzərdən keçirin. OLAP (OnLine Analytical Processing) termini daha əvvəlki OLTP (OnLine Transactions Processing) termininə əlavə olaraq İngilis riyaziyyatçısı Edqar Kodd tərəfindən təqdim edilmişdir. Bu barədə daha sonra danışılacaq, lakin E.Codd, əlbəttə ki, OLTP və OLAP-ın təkcə terminləri deyil, həm də riyazi nəzəriyyələrini təklif etmişdir. Təfərrüatlara varmadan, OLTP-nin müasir təfsirində məlumatın qeydiyyatı, saxlanması və əldə edilməsi mexanizmi hesab edilən əlaqəli verilənlər bazasıdır.

    Həll metodologiyası

    1C7, 1C8, MS Dynamics AX kimi ERP sistemləri (Müəssisə Resurslarının Planlaşdırılması) istifadəçi yönümlü proqram interfeyslərinə (sənədlərin daxil edilməsi və düzəldilməsi və s.) və bu gün təqdim olunan məlumatların saxlanması və əldə edilməsi üçün əlaqəli verilənlər bazasına (DB) malikdir. proqram məhsulları MS SQL Server (SS) yazın.

    Qeyd edək ki, ERP sisteminin məlumat bazasında qeydə alınan məlumatlar həqiqətən də çox qiymətli resursdur. Məsələ ondadır ki, qeydiyyatdan keçmiş məlumat korporasiyanın cari iş axınını (sənədlərin verilməsi, onların düzəldilməsi, çap və tutuşdurma imkanı və s.) təmin edir və təkcə hesablama imkanını deyil. Maliyyə hesabatları(vergilər, audit və s.). İdarəetmə nöqteyi-nəzərindən OLTP sisteminin (əlaqəli verilənlər bazası) əslində korporasiya fəaliyyətinin tam ölçüdə faktiki rəqəmsal modeli olması daha vacibdir.

    Amma prosesi idarə etmək üçün bu barədə məlumatların qeydiyyata alınması kifayət deyil. Proses onun gedişatını xarakterizə edən ədədi göstəricilər sistemi (KPI) kimi təqdim edilməlidir. Bundan əlavə, göstəricilər üçün icazə verilən dəyər diapazonları müəyyən edilməlidir. Və yalnız göstəricinin dəyəri icazə verilən intervaldan kənara çıxdıqda, nəzarət hərəkəti izlənməlidir.

    İdarəetmənin belə məntiqinə (və ya mifologiyasına) ("sapma yolu ilə idarəetmə") gəlincə, həm qayıq yoldan çıxanda avara söykənən sükançı (cybernos) obrazını yaradan qədim yunan filosofu Platon, həm də Amerika riyaziyyatçısı Norbert Wiener, kompüterlər erasının astanasında kibernetika elmini yaradan.

    OLTP metodundan istifadə edərək məlumatların qeyd edilməsi üçün adi sistemə əlavə olaraq, daha bir sistemə ehtiyac var - toplanmış məlumatları təhlil etmək üçün sistem. İdarəetmə dövrəsində idarəetmə ilə idarəetmə obyekti arasında əks əlaqə rolunu oynayan bu əlavə OLAP sistemi və ya qısacası OLAP kubudur.

    OLAP-ın proqram təminatının tətbiqi olaraq biz SSAS kimi qısaldılmış MS SQL Serverin standart çatdırılmasının bir hissəsi olan MS Analysis Services yardım proqramını nəzərdən keçirəcəyik. Qeyd edək ki, E. Coddun fikrinə görə, analitikada OLAP kubu OLTP sistemi və relyasiya verilənlər bazası (SQL Server) məlumatın saxlanması və alınması zamanı verdiyi tam fəaliyyət azadlığını verməlidir.

    OLAP Logistics

    İndi OLAP kubunun avtomatlaşdırılmış işinin əsaslandığı xarici cihazların, tətbiqlərin və texnoloji əməliyyatların xüsusi konfiqurasiyasını nəzərdən keçirək.

    Güman edəcəyik ki, korporasiya ERP sistemindən istifadə edir, məsələn, 1C7 və ya 1C8, daxilində məlumat adi qaydada qeydiyyata alınır. Bu ERP-sisteminin verilənlər bazası müəyyən serverdə yerləşir və MS SQL Server tərəfindən saxlanılır.

    Proqram təminatının başqa serverdə, o cümlədən MS Analysis Services (SSAS) yardım proqramı ilə MS SQL Serverdə, həmçinin MS SQL Server Management Studio, MS C#, MS Excel və MS Visual Studio proqramlarında quraşdırıldığını güman edəcəyik. Bu proqramlar birlikdə tələb olunan konteksti təşkil edir: OLAP kub tərtibçisi üçün alətlər və lazımi interfeyslər.

    SSAS serverində əmr satırından (parametrləri ilə) çağırılan və poçt xidmətini təmin edən blat adlı pulsuz proqram var.

    İşçilərin iş yerlərində, daxilində yerli şəbəkə, digər şeylər arasında, MS Excel proqramları (versiya 2003 və ya daha yüksək), həmçinin, MS Excel-in MS Analysis Services ilə işləməsini təmin etmək üçün xüsusi bir sürücü (müvafiq sürücü artıq MS Excel-ə daxil edilmədikdə) quraşdırılmışdır.

    Dəqiqlik üçün biz fərz edəcəyik ki, işçilərin iş stansiyalarında Windows XP əməliyyat sistemi, serverlərdə isə Windows Server 2008 quraşdırılıb.Bundan əlavə, MS SQL Server 2005 SQL Server və Enterprise Edition (EE) kimi istifadə olunsun və ya Developer Edition (DE). Bu nəşrlərdə sözdə istifadə etmək mümkündür. "yarı əlavə tədbirlər", yəni. müntəzəm məbləğlərdən başqa əlavə məcmu funksiyalar (statistika) (məsələn, ekstremum və ya orta dəyər).

    OLAP kub dizaynı (OLAP kubizmi)

    OLAP kubunun özünün dizaynı haqqında bir neçə söz deyək. Statistikanın dili ilə desək, OLAP kubu bütün lazımi bölmələrdə hesablanmış performans göstəriciləri toplusudur, məsələn, alıcılar, mallar, tarixlər üzrə bölmələr üzrə göndərmə göstəricisi və s. OLAP kublarındakı rus ədəbiyyatında ingilis dilindən birbaşa tərcümə edildiyinə görə göstəricilər "ölçülər", kəsiklər isə "ölçülər" adlanır. Bu, riyazi cəhətdən düzgün, lakin sintaktik və semantik baxımdan çox uğurlu tərcümə deyil. Rus dilindəki "measure", "measurement", "dimension" sözləri məna və yazılış baxımından demək olar ki, fərqlənmir, ingiliscə "measure" və "dimension" isə həm yazılış, həm də məna baxımından fərqlidir. Buna görə də biz “göstərici” və “kəsmə” mənalarına yaxın olan ənənəvi rus statistik terminlərinə üstünlük veririk.

    Məlumatların daxil olduğu OLTP sistemi ilə bağlı OLAP kubunun proqram təminatının tətbiqi üçün bir neçə variant var. Ən sadə, ən etibarlı və ən sürətli olan yalnız bir sxemi nəzərdən keçirəcəyik.

    Bu sxemdə OLAP və OLTP-nin ümumi cədvəlləri yoxdur və OLAP analitikası istifadə mərhələsindən əvvəl Kub Yeniləmə (Proses) mərhələsində mümkün qədər ətraflı hesablanır. Bu sxem MOLAP (Çoxölçülü OLAP) adlanır. Onun çatışmazlıqları ERP ilə asinxroniya və yüksək yaddaş xərcləridir.

    Formal olaraq bir OLAP kubu məlumat mənbəyi kimi ERP sisteminin relational verilənlər bazasının bütün (minlərlə) cədvəlindən və onların bütün (yüzlərlə) sahələrindən göstəricilər və ya bölmələr kimi istifadə edilməklə tikilə bilsə də, əslində bunu etmək olmaz. Əksinə. Bir kuba yükləmək üçün "vitrin" və ya "anbar" (anbar) adlı ayrıca məlumat bazası hazırlamaq daha düzgündür.

    Bunun bir neçə səbəbi var.

    • İlk olaraq, OLAP kubunu cədvəllərlə əlaqələndirmək real baza məlumatlar, şübhəsiz ki, texniki problemlər yaradacaq. Cədvəldəki məlumatların dəyişdirilməsi kubun yenilənməsinə səbəb ola bilər və kubun təzələnməsi mütləq sürətli proses deyil, ona görə də kub daimi yenidən qurulma vəziyyətində olacaq; eyni zamanda kubun yenilənməsi proseduru verilənlər bazası cədvəllərinin məlumatlarını bloklaya bilər (oxu zamanı), ERP sistemində məlumatların qeydiyyatı zamanı istifadəçilərin işini ləngidə bilər.
    • İkincisi, çox göstəricilərin və kəsiklərin olması serverdə kubun saxlama sahəsini kəskin şəkildə artıracaqdır. Unutmayaq ki, OLAP kubu OLTP sistemində olduğu kimi təkcə ilkin məlumatları deyil, həm də bütün mümkün bölmələr üzrə (və hətta bütün bölmələrin bütün kombinasiyaları üzrə) ümumiləşdirilmiş bütün göstəriciləri saxlayır. Bundan əlavə, kubun yenilənmə sürəti və nəhayət, onların əsasında analitika və istifadəçi hesabatlarının qurulması və yenilənməsi sürəti müvafiq olaraq yavaşlayacaq.
    • üçüncü, çoxlu sahələr (tədbirlər və aspektlər) OLAP tərtibatçı interfeysində problemlər yaradacaq, çünki elementlərin siyahısı sonsuz olacaq.
    • Dördüncü, OLAP kubu verilənlərin bütövlüyünün pozulmasına çox həssasdır. Əgər əsas məlumatlar kub sahələrinin keçid strukturunda müəyyən edilmiş keçiddə yerləşmirsə, kub tikilə bilməz. Müvəqqəti və ya daimi bütövlüyün pozulması, boş sahələr ERP sisteminin verilənlər bazasında geniş yayılmışdır, lakin bu, OLAP üçün qəti şəkildə uyğun deyil.

    Siz həmçinin əlavə edə bilərsiniz ki, yükü bölüşmək üçün ERP sistemi və OLAP kubu müxtəlif serverlərdə yerləşməlidir. Ancaq sonra, OLAP və OLTP üçün ümumi cədvəllər varsa, şəbəkə trafiki problemi də var. Bir neçə heterojen ERP sistemini (1C7, 1C8, MS Dynamics AX) bir OLAP kubunda birləşdirmək lazımdırsa, bu vəziyyətdə praktiki olaraq həll olunmayan problemlər ortaya çıxır.

    Yəqin ki, texniki problemləri daha da yığmaq olar. Ancaq ən əsası, unutmayın ki, OLTP-dən fərqli olaraq, OLAP məlumatların qeydiyyatı və saxlanması vasitəsi deyil, analitika vasitəsidir. Bu o deməkdir ki, ERP-dən OLAP-a "çirkli" verilənləri "hər halda" yükləməyə və yükləməyə ehtiyac yoxdur. Əksinə, əvvəlcə ən azı KPI sistem səviyyəsində bir şirkəti idarə etmək üçün bir konsepsiya hazırlamalı və sonra OLAP kubu ilə eyni serverdə yerləşən və az miqdarda dəqiqləşdirilmiş ERP ehtiva edən proqram məlumat anbarını (anbarını) dizayn etməlisiniz. idarəetmə üçün lazım olan məlumatlar.

    Təbliğ etmir pis vərdişlər, OLTP-yə münasibətdə OLAP-kubunu məşhur "alembik kub"a bənzətmək olar, onun vasitəsilə real qeydiyyatın "mayalanmış kütləsindən" "təmiz məhsul" çıxarılır.

    Beləliklə, OLAP üçün məlumat mənbəyinin OLAP ilə eyni serverdə yerləşən xüsusi verilənlər bazası (anbar) olduğunu əldə etdik. Əsasən, bu iki şey deməkdir. Birincisi, ERP verilənlər bazalarından anbar yaradacaq xüsusi prosedurlar olmalıdır. İkincisi, OLAP kubu ERP sistemləri ilə asinxrondur.

    Yuxarıda göstərilənləri nəzərə alaraq, hesablama prosesinin arxitekturasının aşağıdakı variantını təklif edirik.

    Həll arxitekturası

    Fərqli serverlərdə müəyyən bir korporasiyanın (holdinqin) çoxlu ERP sistemi olsun, bunun üçün bir OLAP kubu daxilində analitik məlumatların birləşdirilməsini görmək istərdik. Təsvir edilən texnologiyada ERP sistemlərindən məlumatları anbar səviyyəsində birləşdirdiyimizi və OLAP kubunun dizaynını dəyişməz qoyduğumuzu vurğulayırıq.

    OLAP serverində biz bütün bu ERP sistemlərinin verilənlər bazalarının şəkillərini (boş nüsxələrini) yaradırıq. Bu boş nüsxələrə biz vaxtaşırı (gecə) müvafiq aktiv işləyən ERP-lərin verilənlər bazalarının qismən təkrarlanmasını həyata keçiririk.

    Sonra, şəbəkə trafiki olmayan eyni OLAP serverində, ERP sistemlərinin verilənlər bazalarının qismən replikaları əsasında OLAP-ın məlumat mənbəyi olan yaddaşı (anbarı) yaradan (və ya dolduran) SP (saxlanan prosedur) işə salınır. kub.

    Sonra anbar məlumatlarına uyğun olaraq bir kubun yenilənməsi / qurulması üçün standart prosedur işə salınır (SSAS interfeysində Proses əməliyyatı).

    Texnologiyanın bəzi aspektlərini şərh edək. SP-lər hansı işlərlə məşğul olurlar?

    Qismən təkrarlama nəticəsində faktiki məlumatlar OLAP serverində bəzi ERP sisteminin təsvirində görünür. Yeri gəlmişkən, qismən təkrarlama iki yolla edilə bilər.

    Birincisi, ERP sisteminin verilənlər bazasındakı bütün cədvəllərdən qismən təkrarlama zamanı yalnız anbar qurmaq üçün lazım olanlar kopyalanır. Bu cədvəl adlarının sabit siyahısı ilə idarə olunur.

    İkincisi, qismən təkrarlama, cədvəlin bütün sahələrinin deyil, yalnız anbarın qurulmasında iştirak edənlərin kopyalandığını ifadə edə bilər. Kopyalanacaq sahələrin siyahısı ya dəqiqləşdirilir, ya da surət şəklindən SP-də dinamik şəkildə yaradılır (əgər cədvəlin surəti əvvəlcə bütün sahələri ehtiva etmirsə).

    Əlbəttə ki, bütün cədvəl sətirlərini köçürmək deyil, yalnız yeni qeydlər əlavə etmək mümkündür. Bununla belə, bu, real həyat sistemlərində tez-tez rast gəlinən “backdating” ERP reviziyalarının uçotu zamanı ciddi narahatlıq yaradır. Beləliklə, daha çox uzatmadan, bütün qeydləri kopyalamaq (və ya müəyyən bir tarixdən başlayaraq "quyruğunu" yeniləmək) daha asandır.

    Bundan əlavə, SP-nin əsas vəzifəsi məlumatları ERP sistemlərindən anbar formatına çevirməkdir. Yalnız bir ERP sistemi varsa, transformasiya vəzifəsi əsasən lazımi məlumatların surətini çıxarmaq və bəlkə də yenidən formatlaşdırmaqdan ibarətdir. Ancaq eyni OLAP kubunda bir neçə ERP sistemini birləşdirmək lazımdırsa fərqli quruluş, sonra çevrilmələr daha da mürəkkəbləşir.

    Bir neçə fərqli ERP sisteminin kubda birləşdirilməsi işi xüsusilə çətindir, əgər onların obyektlərinin dəstləri (malların kataloqları, podratçılar, anbarlar və s.) qismən kəsişirsə, obyektlər eyni məna daşıyır, lakin təbii olaraq onlar fərqli şəkildə təsvir olunur. kataloqlar müxtəlif sistemlər(kodlar, identifikatorlar, adlar və s. mənasında).

    Əslində, belə bir mənzərə böyük bir holdinqdə yaranır, onu təşkil edən eyni tipli bir neçə muxtar şirkət təxminən eyni ərazidə təxminən eyni fəaliyyət növlərini həyata keçirir, lakin öz və əlaqələndirilməmiş qeydiyyat sistemlərindən istifadə edir. Bu vəziyyətdə, məlumatları anbar səviyyəsində birləşdirərkən, köməkçi xəritələşdirmə cədvəlləri olmadan edə bilməzsiniz.

    Anbar saxlama arxitekturasına bir az diqqət yetirək. Tipik olaraq, OLAP kub sxemi "ulduz" kimi təqdim olunur, yəni. qovluqların "şüaları" ilə əhatə olunmuş məlumat cədvəli kimi - ikinci dərəcəli açar dəyərlər cədvəlləri. Cədvəl "göstəricilər" blokudur, istinad kitabları onların kəsikləridir. Eyni zamanda, kataloq, öz növbəsində, ixtiyari balanssız ağac və ya balanslaşdırılmış iyerarxiya, məsələn, malların və ya qarşı tərəflərin çox səviyyəli təsnifatı ola bilər. OLAP kubunda anbardan verilənlər cədvəlinin ədədi sahələri avtomatik olaraq "göstəricilərə" (və ya ölçülərə) çevrilir və bölmələr (və ya ölçülər) ikinci dərəcəli açarların cədvəlləri vasitəsilə müəyyən edilə bilər.

    Bu vizual "pedaqoji" təsvirdir. Əslində, OLAP kubunun arxitekturası daha mürəkkəb ola bilər.

    Birincisi, anbar, ola bilsin ki, ümumi kataloqlar vasitəsilə əlaqələndirilmiş bir neçə "ulduz"dan ibarət ola bilər. Bu halda, OLAP kubu bir neçə kubun (birdən çox məlumat blokunun) birliyi olacaqdır.

    İkincisi, ulduz işarəsinin "şüası" bir kataloq deyil, bütöv (ierarxik) fayl sistemi ola bilər.

    Üçüncüsü, mövcud ölçü kəsikləri əsasında OLAP tərtibatçı interfeysindən istifadə etməklə yeni iyerarxik kəsiklər müəyyən edilə bilər (məsələn, daha az səviyyəli, səviyyələrin fərqli sırası ilə və s.)

    Dördüncüsü, MDX dilinin ifadəsindən istifadə etməklə mövcud göstəricilər və bölmələr əsasında yeni göstəricilər (hesablamalar) müəyyən edilə bilər. Qeyd etmək vacibdir ki, yeni kublar, yeni göstəricilər, yeni bölmələr avtomatik olaraq orijinal elementlərlə tam inteqrasiya olunur. Həm də qeyd etmək lazımdır ki, zəif tərtib edilmiş hesablamalar və iyerarxik kəsiklər OLAP kubunun işini nəzərəçarpacaq dərəcədə yavaşlata bilər.

    MS Excel OLAP ilə interfeys kimi

    OLAP kubları ilə istifadəçi interfeysi xüsusi maraq doğurur. Təbii ki, SSAS yardım proqramının özü ən tam interfeysi təmin edir. Bu, OLAP kub tərtibatçı alət dəsti, interaktiv hesabat dizayneri və MDX dilində sorğulardan istifadə edərək OLAP kubu ilə interaktiv iş üçün pəncərədir.

    SSAS-ın özündən əlavə, OLAP-a interfeys təqdim edən, onların funksionallığını az və ya çox dərəcədə əhatə edən bir çox proqramlar mövcuddur. Ancaq onların arasında, fikrimizcə, danılmaz üstünlükləri olan biri var. Bu MS Exceldir.

    MS Excel ilə interfeys ayrıca yüklənə və ya Excel-ə daxil edilə bilən xüsusi bir sürücü ilə təmin edilir. O, OLAP-ın bütün funksionallığını əhatə etmir, lakin MS Excel versiya nömrələrinin artması ilə bu əhatə dairəsi daha da genişlənir (məsələn, MS Excel 2007-də ​​MS Excel 2003-də olmayan KPI qrafiki görünür və s.).

    Əlbəttə ki, kifayət qədər tam funksionallıqdan əlavə, MS Excel-in əsas üstünlüyü bu proqramın hər yerdə yayılması və ofis istifadəçilərinin böyük əksəriyyətinin onunla yaxından tanış olmasıdır. Bu mənada, digər interfeys proqramlarından fərqli olaraq, firma əlavə olaraq heç bir şey əldə etməyə ehtiyac duymur və əlavə olaraq heç kimə öyrətməyə ehtiyac duymur.

    OLAP ilə bir interfeys kimi MS Excel-in böyük üstünlüyü OLAP hesabatında əldə edilən məlumatların sonrakı müstəqil işlənməsi imkanıdır (yəni, OLAP-dan alınan məlumatların eyni Excel-in digər vərəqlərində öyrənilməsinin davam etdirilməsi, artıq istifadə edilməməsi). OLAP alətləri, lakin adi Excel alətlərindən istifadə etməklə).

    Gecə facubi müalicə dövrü

    İndi OLAP əməliyyatının gündəlik (gecə) hesablama dövrünü təsvir edək. Hesablama C # 2005-də yazılmış facubi proqramının nəzarəti altında aparılır və anbar və SSAS ilə serverdə Tapşırıq Planlayıcısından istifadə edərək işə salınır. Başlanğıcda facubi internetə daxil olur və cari valyuta məzənnələrini oxuyur (valyutada bir sıra göstəriciləri təmsil etmək üçün istifadə olunur). Sonra, aşağıdakı addımlar yerinə yetirilir.

    Birincisi, facubi yerli şəbəkədə mövcud olan müxtəlif ERP sistemlərinin (tutma elementləri) qismən verilənlər bazası replikasiyasını həyata keçirən SP-ləri işə salır. Replikasiya, dediyimiz kimi, əvvəlcədən hazırlanmış "həyətlərdə" - SSAS serverində yerləşən uzaq ERP sistemlərinin təsvirlərində həyata keçirilir.

    İkincisi, SP vasitəsilə ERP replikalarından anbar anbarına - OLAP kub məlumatlarının mənbəyi olan və SSAS serverində yerləşən xüsusi DB-yə xəritəçəkmə aparılır. Bu üç əsas vəzifəni yerinə yetirir:

    • ERP məlumatları tələb olunan kub formatları altında gətirilir; biz cədvəllərdən və cədvəl sahələrindən danışırıq. (Bəzən tələb olunan cədvəli bir neçə MS Excel vərəqindən “qəlibə salmaq lazımdır”.) Oxşar məlumatlar müxtəlif ERP-lərdə fərqli formata malik ola bilər, məsələn, 1C7 kataloqlarındakı əsas ID sahələrinin uzunluğu 8 olan 36 simvol kodu var. , və 1C8 kataloqlarında _idrref sahələri - uzunluğu 32 olan onaltılıq ədədlər;
    • emal zamanı məlumatların məntiqi nəzarəti həyata keçirilir (mümkün olduqda çatışmayan məlumatların yerinə "defolt" defoltunun təyin edilməsi daxil olmaqla) və bütövlüyünə nəzarət, yəni. müvafiq klassifikatorlarda ilkin və ikinci dərəcəli açarların mövcudluğunun yoxlanılması;
    • kodun konsolidasiyası müxtəlif ERP-lərdə eyni məna daşıyan obyektlər. Məsələn, müxtəlif ERP-lərin qovluqlarının müvafiq elementləri eyni mənaya malik ola bilər, deyək ki, bu eyni qarşı tərəfdir. Kodların birləşdirilməsi vəzifəsi eyni obyektlərin müxtəlif kodlarının birliyə gətirildiyi xəritəçəkmə cədvəllərinin qurulması ilə həll edilir.

    Üçüncüsü, facubi standart Proses kubu məlumatlarını yeniləmə prosedurunu işə salır (SSAS kommunal prosedurlarından).

    Yoxlama siyahılarına əsasən, facubi emal addımlarının gedişatı haqqında e-poçt mesajları göndərir.

    Facubi yerinə yetirdikdən sonra Tapşırıq Planlayıcısı növbə ilə bir neçə excel faylını işə salır, bu fayllarda OLAP kub göstəriciləri əsasında hesabatlar əvvəlcədən yaradılmışdır. Dediyimiz kimi, MS Excel-də OLAP kubları ilə (SSAS ilə) işləmək üçün xüsusi proqramlaşdırma interfeysi (ayrıca yüklənə bilən və ya quraşdırılmış sürücü) var. MS Excel proqramını işə saldığınız zaman hesabatlarda məlumatların yenilənməsini təmin edən MS VBA-da proqramlar (makroslar kimi) daxil edilir; hesabatlar zəruri hallarda dəyişdirilir və yoxlama siyahılarına uyğun olaraq poçtla (blat proqramı) istifadəçilərə göndərilir.

    SSAS serverinə çıxışı olan yerli şəbəkə istifadəçiləri OLAP kubu üçün konfiqurasiya edilmiş "canlı" hesabatları alacaqlar. (Prinsipcə, onlar heç bir poçt olmadan, MS Excel-də OLAP hesabatlarını yerli kompüterlərində yeniləyə bilərlər.) Lokal şəbəkədən kənar istifadəçilər ya orijinal hesabatlar alacaqlar, lakin funksionallığı məhduddur, ya da onlar üçün (OLAP hesabatlarını yenilədikdən sonra) MS Excel-də) SSAS serveri ilə əlaqə saxlamayan xüsusi "ölü" hesabatlar hesablanacaq.

    Nəticələrin qiymətləndirilməsi

    Yuxarıda OLTP və OLAP-ın asinxroniyası haqqında danışdıq. Texnologiyanın nəzərdən keçirilən versiyasında OLAP kub yeniləmə dövrü gecə həyata keçirilir (məsələn, səhər saat 1-də başlayır). Bu o deməkdir ki, cari iş günündə istifadəçilər dünənki məlumatlarla işləyirlər. OLAP giriş aləti deyil (sənədin ən son versiyasına baxın), lakin idarəetmə vasitəsi (prosesin tendensiyasını başa düşmək) olduğundan, bu geriləmə adətən kritik deyil. Bununla belə, zərurət yaranarsa, hətta kub arxitekturasının (MOLAP) təsvir edilmiş versiyasında da gündə bir neçə dəfə yeniləmək mümkündür.

    Yeniləmə prosedurlarının icra müddəti OLAP kubunun dizayn xüsusiyyətlərindən (daha az mürəkkəblik, göstəricilərin və bölmələrin az və ya çox uğurlu tərifləri) və xarici OLTP sistemlərinin verilənlər bazalarının həcmindən asılıdır. Təcrübəyə görə, anbarın qurulması prosedurları bir neçə dəqiqədən iki saata qədər, kubun yenilənməsi proseduru (Proses) 1 ilə 20 dəqiqə çəkir. Söhbət onlarla ulduz strukturunu, onlar üçün təxminən onlarla ümumi “şüaları” (istinad kəsimlərini), yüzlərlə göstəricini birləşdirən mürəkkəb OLAP kublarından gedir. Göndərmə sənədləri ilə xarici ERP sistemlərinin məlumat bazalarının həcmini qiymətləndirərkən, söhbət yüz minlərlə sənəddən və müvafiq olaraq ildə milyonlarla məhsul xəttindən gedir. İstifadəçini maraqlandıran tarixi emal dərinliyi üç-beş il idi.

    Təsvir edilən texnologiya bir sıra böyük korporasiyalarda istifadə olunur: 2008-ci ildən Rusiya Balıq Şirkəti (RRK) və Rusiya Dəniz Şirkətində (RM), 2012-ci ildən Santa Bremor Şirkətində (SB). Korporasiyaların bəziləri əsasən ticarət-alıcı firmalar (RRK), digərləri istehsal firmalarıdır (Moldova Respublikasında balıq və dəniz məhsulları emalı zavodları və Təhlükəsizlik Şurası). Bütün korporasiyalar 1C7 və 1C8 kimi standart ERP sistemlərindən tutmuş DBF və Excel-ə əsaslanan “relikt” mühasibat sistemlərinə qədər bir neçə şirkəti müstəqil və müxtəlif kompüter uçot sistemləri ilə birləşdirən böyük holdinqlərdir. Əlavə edəcəyəm ki, OLAP kublarını idarə etmək üçün təsvir olunan texnologiya (inkişaf mərhələsini nəzərə almadan) ya ümumiyyətlə xüsusi işçilər tələb etmir, ya da bir tam ştatlı biznes analitikinin öhdəliklərinə daxildir. Tapşırıq illərdir ki, avtomatik rejimdə işləyir və hər gün müxtəlif kateqoriyalı korporativ işçiləri müasir hesabatlarla təmin edir.

    Həllin müsbət və mənfi tərəfləri

    Təcrübə göstərir ki, təklif olunan həll variantı kifayət qədər etibarlı və istifadəsi asandır. Facubi nəzarət proqramının dəyişməzliyi ilə asanlıqla dəyişdirilir (yeni ERP-ləri qoşmaq / ayırmaq, yeni göstəricilər və bölmələr yaratmaq, Excel hesabatlarını və onların poçt siyahılarını yaratmaq və dəyişdirmək).

    OLAP ilə interfeys kimi MS Excel kifayət qədər ifadəliliyi təmin edir və müxtəlif kateqoriyalı ofis işçilərinə OLAP texnologiyasına tez qoşulmağa imkan verir. İstifadəçi gündəlik "standart" OLAP hesabatlarını alır; OLAP ilə MS Excel interfeysindən istifadə edərək, MS Excel-də müstəqil olaraq OLAP hesabatları yarada bilər. Bundan əlavə, istifadəçi MS Excel-in adi imkanlarından istifadə edərək OLAP hesabatlarının məlumatlarını müstəqil şəkildə araşdırmağa davam edə bilər.

    Hətta heç bir OLAP olmadan bir neçə heterojen ERP sisteminin birləşdirildiyi (kubun qurulması zamanı) "zərif" anbar bazası həll etməyə imkan verir (SSAS serverində, Transact SQL sorğu metodundan və ya SP metodundan istifadə etməklə və s.) çoxlu tətbiq olunan idarəetmə tapşırıqları. Xatırladaq ki, anbar verilənlər bazası strukturu vahiddir və orijinal ERP-nin verilənlər bazası strukturlarına nisbətən daha sadədir (cədvəllərin sayı və cədvəl sahələrinin sayı baxımından).

    Xüsusilə qeyd edirik ki, təklif etdiyimiz həllimizdə müxtəlif ERP sistemlərini bir OLAP kubunda birləşdirmək imkanı var. Bu, bütün holdinq üçün analitika əldə etməyə və korporasiya başqa ERP mühasibat sisteminə keçdikdə, məsələn, 1C7-dən 1C8-ə keçərkən analitikada uzunmüddətli davamlılığı təmin etməyə imkan verir.

    MOLAP kub modelindən istifadə etdik. Bu modelin üstünlükləri əməliyyatda etibarlılıq və istifadəçi sorğularının yüksək sürətdə işləməsidir. Eksiler - asinxron OLAP və OLTP, həmçinin OLAP-ın saxlanması üçün böyük həcmdə yaddaş.

    Yekun olaraq, OLAP-ın lehinə daha bir arqument verək ki, bu, bəlkə də orta əsrlərdə daha uyğun olardı. Çünki onun sübut gücü səlahiyyətə əsaslanır. Təvazökar, açıq-aşkar qiymətləndirilməmiş britaniyalı riyaziyyatçı E. Codd 60-cı illərin sonlarında əlaqəli verilənlər bazaları nəzəriyyəsini inkişaf etdirdi. Bu nəzəriyyənin gücü o idi ki, indi 50 ildən sonra SQL-dən başqa qeyri-relational verilənlər bazası və verilənlər bazası sorğu dilini tapmaq artıq çətindir.

    Relational verilənlər bazası nəzəriyyəsinə əsaslanan OLTP texnologiyası E.Coddun ilk ideyası olmuşdur. Əslində, OLAP kubları konsepsiyası onun 90-cı illərin əvvəllərində ifadə etdiyi ikinci ideyasıdır. Riyaziyyatçı olmasanız belə, ikinci fikrin birincisi qədər təsirli olacağını gözləyə bilərsiniz. Yəni, kompüter analitikası baxımından OLAP ideyaları tezliklə dünyanı ələ keçirəcək və bütün digərlərini sıxışdıracaq. Sadəcə ona görə ki, analitika mövzusu özünün tam riyazi həllini OLAP-da tapır və bu həll analitikanın praktiki vəzifəsinə “adekvatdır” (B.Spinoza termini). Spinozada “adekvat” o deməkdir ki, hətta Tanrının özü də bundan yaxşı ideya irəli sürə bilməzdi...

    1. Larson B. Microsoft SQL Server 2005-də biznes intellektinin inkişafı. - Sankt-Peterburq: "Piter", 2008.
    2. Codd E. Verilənlər Bazasının Altdillərinin Əlaqəli Tamlığı, Məlumat Baza Sistemləri, Courant Kompüter Elmi Sumposia Series 1972, v. 6, Englwood Cliffs, N.Y., Prentice-Hall.

    ilə təmasda

    Bu gün OLAP nədir, ümumiyyətlə, hər bir mütəxəssis bilir. Ən azından "OLAP" və "çoxölçülü məlumatlar" anlayışları beynimizdə möhkəm bağlıdır. Buna baxmayaraq, bu mövzunun yenidən gündəmə gəlməsi, ümid edirəm, oxucuların əksəriyyəti tərəfindən bəyəniləcək, çünki ideyanın zamanla köhnəlməməsi üçün vaxtaşırı əlaqə saxlamalısınız. ağıllı insanlar ya da yaxşı bir nəşrdə məqalələr oxuyun...

    Məlumat anbarları (OLAP-ın müəssisənin informasiya strukturunda yeri)

    "OLAP" termini "məlumat anbarı" (Data Warehouse) termini ilə ayrılmaz şəkildə bağlıdır.

    Məlumat anbarlarının "təsis atası" Bill İnmon tərəfindən tərtib edilmiş tərif budur: "Məlumat anbarı idarəetmə qərarlarının qəbulu prosesini dəstəkləmək üçün domenə xas, vaxta bağlı və dəyişməz məlumat toplusudur."

    Yaddaşdakı məlumatlar iş proseslərini avtomatlaşdırmaq üçün nəzərdə tutulmuş əməliyyat sistemlərindən (OLTP sistemləri) gəlir. Bundan əlavə, anbar xarici mənbələrdən, məsələn, statistik hesabatlardan doldurula bilər.

    Nəyə görə məlumat anbarları qurmaq lazımdır - axı onlar əməliyyat sistemlərinin verilənlər bazalarında və ya fayllarında artıq "yaşayan" açıq-aşkar lazımsız məlumatları ehtiva edir? Cavab qısa ola bilər: əməliyyat sistemlərinin məlumatlarını birbaşa təhlil etmək mümkün deyil və ya çox çətindir. Bu, müxtəlif səbəblərlə, o cümlədən məlumatların parçalanması, onların müxtəlif DBMS formatlarında və korporativ şəbəkənin müxtəlif “guşələrində” saxlanması ilə bağlıdır. Lakin müəssisədəki bütün məlumatlar mərkəzi verilənlər bazası serverində saxlansa belə (bu olduqca nadirdir), analitik onların mürəkkəb, bəzən çaşdırıcı strukturlarını demək olar ki, başa düşməyəcək. Müəllif ac analitikləri əməliyyat sistemlərinin "xam" məlumatları ilə "qidalandırmaq" cəhdində kifayət qədər kədərli təcrübəyə malikdir - bu, onlar üçün çox çətin oldu.

    Beləliklə, anbarın vəzifəsi bir yerdə və sadə, başa düşülən strukturda təhlil üçün "xammal" təmin etməkdir. Ralf Kimball “The Data Warehouse Toolbar” kitabının ön sözündə yazır ki, əgər oxucu bütün kitabı oxuduqdan sonra yalnız bir şeyi başa düşsə, yəni anbarın strukturunun sadə olması lazım olduğunu başa düşsə, müəllif öz vəzifəsini nəzərdən keçirəcək. tamamlandı.

    Ayrı bir anbarın görünüşünü əsaslandıran başqa bir səbəb var - əməliyyat məlumatı üçün mürəkkəb analitik sorğular şirkətin cari işini ləngidir, cədvəlləri uzun müddət bloklayır və server resurslarını ələ keçirir.

    Məncə, saxlama mütləq məlumatların nəhəng yığılması deyil - əsas odur ki, təhlil üçün əlverişlidir. Ümumiyyətlə, ayrı bir termin kiçik anbarlar üçün nəzərdə tutulub - Data Marts (data kioskları), lakin bizim rus təcrübəmizdə bunu tez-tez eşitməyəcəksiniz.

    OLAP lazımlı analiz alətidir

    Mərkəzləşmə və rahat strukturlaşma analitikin ehtiyac duyduğu hər şeydən uzaqdır. Axı ona hələ də məlumatı görmək, vizuallaşdırmaq üçün alət lazımdır. Ənənəvi hesabatlar, hətta tək bir depo əsasında qurulmuşdur, bir şey yoxdur - çeviklik. Məlumatların istənilən görünüşünü əldə etmək üçün onları "bükmək", "genişləndirmək" və ya "yıxmaq" mümkün deyil. Əlbəttə ki, bir proqramçıya zəng edə bilərsiniz (əgər o gəlmək istəsə) və o (əgər məşğul deyilsə) kifayət qədər tez yeni hesabat verəcək - deyin, bir saat ərzində (yazıram və özüm buna inanmıram - həyatda belə tez baş vermir, ona üç saat vaxt verək) . Belə çıxır ki, analitik gündə ikidən çox ideya yoxlaya bilər. Və o (yaxşı analitikdirsə) saatda bir neçə belə ideya irəli sürə bilər. Və analitik nə qədər çox məlumat "dilimləri" və "dilimləri" görsə, bir o qədər çox ideyaya sahib olur və bu da öz növbəsində yoxlama üçün getdikcə daha çox yeni "dilim" tələb edir. Kaş ki, ona məlumatları sadə və rahat şəkildə genişləndirməyə və yıxmağa imkan verən belə bir alət olsaydı! OLAP belə alətlərdən biridir.

    OLAP məlumat anbarının zəruri atributu olmasa da, bu məlumat anbarında toplanmış məlumatı təhlil etmək üçün getdikcə daha çox istifadə olunur.

    Tipik bir anbara daxil olan komponentlər Şəkildə göstərilmişdir. 1.

    düyü. 1. Məlumat anbarının strukturu

    Əməliyyat məlumatları müxtəlif mənbələrdən toplanır, təmizlənir, inteqrasiya olunur və əlaqəli bir mağazaya yerləşdirilir. Eyni zamanda, onlar müxtəlif hesabat alətlərindən istifadə edərək təhlil üçün artıq mövcuddur. Sonra məlumatlar (tam və ya qismən) OLAP təhlili üçün hazırlanır. Onlar xüsusi OLAP verilənlər bazasına yüklənə və ya əlaqəli mağazada qala bilər. Onun ən vacib elementi metadata, yəni məlumatların strukturu, yerləşdirilməsi və çevrilməsi haqqında məlumatdır. Onların sayəsində müxtəlif saxlama komponentlərinin effektiv qarşılıqlı əlaqəsi təmin edilir.

    Yekun olaraq, OLAP-ı anbarda toplanmış məlumatların çoxölçülü təhlili üçün alətlər toplusu kimi müəyyən edə bilərik. Teorik olaraq, OLAP alətləri birbaşa əməliyyat məlumatlarına və ya onların dəqiq surətlərinə tətbiq oluna bilər (əməliyyat istifadəçilərinə mane olmamaq üçün). Lakin bununla biz yuxarıda təsvir edilmiş dırmıq üzərində addım atmaq, yəni birbaşa təhlil üçün uyğun olmayan əməliyyat məlumatlarını təhlil etməyə başlama riski ilə üzləşirik.

    OLAP-ın tərifi və əsas anlayışları

    Başlamaq üçün, deşifrə edək: OLAP Onlayn Analitik Qenerasiyadır, yəni məlumatların onlayn təhlilidir. OLAP-ın 12 müəyyənedici prinsipi 1993-cü ildə əlaqəli verilənlər bazalarının "ixtiraçısı" E. F. Codd tərəfindən tərtib edilmişdir. Daha sonra onun tərifi, paylaşılan çoxölçülü məlumatları tez təhlil etmək qabiliyyətini təmin etmək üçün OLAP tətbiqini tələb edən FASMI testinə çevrildi ().

    FASMI testi

    Sürətli(Sürətli) - təhlil məlumatın bütün aspektləri üzrə eyni sürətlə aparılmalıdır. Qəbul edilən cavab müddəti 5 saniyə və ya daha azdır.

    Təhlil(Analiz) - Tətbiq tərtibatçısı tərəfindən əvvəlcədən müəyyən edilmiş və ya istifadəçi tərəfindən özbaşına müəyyən edilmiş əsas ədədi və statistik təhlil növlərini yerinə yetirmək mümkün olmalıdır.

    paylaşdı(Paylaşılan) - Çox istifadəçinin məlumatlara girişi olmalıdır, eyni zamanda həssas məlumatlara giriş nəzarət edilməlidir.

    Çoxölçülü(Çoxölçülü) OLAP-ın əsas, ən vacib xüsusiyyətidir.

    məlumat(Məlumat) - proqram həcmindən və saxlanma yerindən asılı olmayaraq istənilən zəruri məlumatı əldə etmək imkanına malik olmalıdır.

    OLAP = Çoxölçülü Görünüş = Kub

    OLAP biznes məlumatlarına daxil olmaq, onlara baxmaq və təhlil etmək üçün rahat, yüksək sürətli vasitələr təqdim edir. İstifadəçi onları çoxölçülü kublar (Kublar) şəklində təşkil edərək təbii, intuitiv məlumat modeli əldə edir. Çoxölçülü koordinat sisteminin oxları təhlil edilən biznes prosesinin əsas atributlarıdır. Məsələn, satış üçün bir məhsul, bölgə, alıcı növü ola bilər. Ölçmələrdən biri kimi vaxtdan istifadə edilir. Baltaların kəsişmə nöqtələrində - ölçmələr (Ölçülər) - prosesi kəmiyyətcə xarakterizə edən məlumatlar - ölçülər (Tədbirlər) var. Bunlar hissə-hissə və ya pul ifadəsində satış həcmləri, səhm qalıqları, xərclər və s. ola bilər. Məlumatı təhlil edən istifadəçi kubu müxtəlif istiqamətlərdə “kəsdirə”, xülasə (məsələn, illər üzrə) və ya əksinə ətraflı (həftəlik) əldə edə bilər. məlumat və təhlil prosesində onun ağlına gələn digər manipulyasiyalar həyata keçirir.

    Şəkildə göstərilən üç ölçülü kubda ölçülər kimi. 2, satış məbləğləri istifadə olunur və ölçmə kimi vaxt, məhsul və mağaza istifadə olunur. Ölçmələr xüsusi qruplaşdırma səviyyələrində təqdim olunur: məhsullar kateqoriyaya görə qruplaşdırılır, mağazalar ölkə üzrə qruplaşdırılır və əməliyyat müddətləri aylara görə qruplaşdırılır. Bir az sonra qruplaşdırma (iyerarxiya) səviyyələrini daha ətraflı nəzərdən keçirəcəyik.


    düyü. 2. Kub nümunəsi

    Kubun "kəsilməsi"

    Hətta üç ölçülü bir kubu kompüter ekranında göstərmək çətindir ki, maraq ölçülərinin dəyərləri görünə bilsin. Üçdən çox ölçüsü olan kublar haqqında nə deyə bilərik? Kubda saxlanılan məlumatları vizuallaşdırmaq üçün, bir qayda olaraq, mürəkkəb iyerarxik sıra və sütun başlıqlarına malik adi ikiölçülü, yəni cədvəlli görünüşlərdən istifadə olunur.

    Bir kubun iki ölçülü təsviri onu bir və ya daha çox ox (ölçülər) üzərindən "kəsməklə" əldə edilə bilər: ikidən başqa bütün ölçülərin dəyərlərini düzəldirik və adi iki ölçülü cədvəl alırıq. . Cədvəlin üfüqi oxu (sütun başlıqları) bir ölçüsü, şaquli ox (sətir başlıqları) digər ölçüsü, cədvəl hüceyrələri isə ölçü dəyərlərini təmsil edir. Bu halda, tədbirlər toplusu əslində ölçülərdən biri hesab olunur - biz ya göstərmək üçün bir ölçü seçirik (sonra sətir və sütunların başlıqlarına iki ölçü yerləşdirə bilərik) və ya bir neçə ölçü göstəririk (və sonra bir Cədvəlin oxları ölçülərin adları ilə, digəri isə tək "kəsilməmiş" ölçünün dəyəri ilə işğal olunacaq).

    Əncirə nəzər salın. 3 - burada bir ölçü üçün kubun iki ölçülü dilimi - Vahid Satış (satılan ədəd) və iki "kəsilməmiş" ölçü - Mağaza (Mağaza) və Vaxt (Vaxt).


    düyü. 3. Bir ölçü üçün iki ölçülü kub dilimi

    Əncirdə. 4 yalnız bir "kəsilməmiş" ölçüsü göstərir - Mağaza, lakin o, bir neçə ölçünün dəyərlərini göstərir - Vahid Satışları (satılan ədədlər), Mağaza Satışları (satış məbləği) və Mağaza Xərcləri (mağaza xərcləri).


    düyü. 4. Çoxsaylı Tədbirlər üçün 2D Kub Dilimləmə

    Kubun iki ölçülü təsviri ikidən çox ölçü "kəsilməmiş" olaraq qaldıqda da mümkündür. Bu halda, "kəsilmiş" kubun iki və ya daha çox ölçüsü dilim oxlarına (sətirlər və sütunlar) yerləşdiriləcək - şək. 5.


    düyü. 5. Eyni oxda bir neçə ölçüləri olan kubun iki ölçülü dilimi

    Teqlər

    Ölçülər boyunca "kənara qoyulan" dəyərlər üzvlər və ya etiketlər (üzvlər) adlanır. Etiketlər həm kubu "kəsmək" üçün, həm də seçilmiş məlumatları məhdudlaşdırmaq (filtrləmək) üçün istifadə olunur - "kəsilməmiş" olaraq qalan ölçüdə bizi bütün dəyərlər maraqlandırmır, lakin onların alt çoxluğu, məsələn, bir neçə şəhərdən üç şəhər onlarla. Etiket dəyərləri 2D kub görünüşündə sətir və sütun başlıqları kimi görünür.

    İerarxiyalar və səviyyələr

    Etiketlər bir və ya bir neçə səviyyədən ibarət iyerarxiyalara birləşdirilə bilər. Məsələn, "Mağaza" (Mağaza) ölçüsünün etiketləri təbii olaraq səviyyələri olan bir iyerarxiyaya birləşdirilir:

    Ölkə (Ölkə)

    Ştat (Ştat)

    Şəhər (Şəhər)

    Mağaza (mağaza).

    İyerarxiya səviyyələrinə görə, ABŞ ("Ölkə" səviyyəsi) və ya Kaliforniya ("Ştat" səviyyəsi) üçün satışlar kimi məcmu dəyərlər hesablanır. Bir ölçüdə birdən çox iyerarxiya həyata keçirilə bilər - zaman üçün deyin: (İl, Rüb, Ay, Gün) və (İl, Həftə, Gün).

    OLAP Tətbiq Memarlığı

    OLAP haqqında yuxarıda deyilənlərin hamısı, əslində, məlumatların çoxölçülü təqdimatına istinad edirdi. Təxminən desək, nə son istifadəçi, nə də müştərinin istifadə etdiyi alətin tərtibatçıları məlumatların necə saxlandığına əhəmiyyət vermirlər.

    OLAP proqramlarında çoxölçülülük üç səviyyəyə bölünə bilər:

    • Çoxölçülü məlumatların təqdimatı - çoxölçülü vizuallaşdırma və məlumatların manipulyasiyasını təmin edən son istifadəçi alətləri; çoxölçülü təmsil qatı verilənlərin fiziki strukturundan mücərrədləşdirir və verilənlərə çoxölçülü kimi yanaşır.
    • Çoxölçülü emal - çoxölçülü sorğuların formalaşdırılması üçün alət (dil) (ənənəvi relational SQL dili burada uyğun deyil) və belə bir sorğunu emal edib icra edə bilən prosessor.
    • Çoxölçülü saxlama - çoxölçülü sorğuların səmərəli icrasını təmin edən verilənlərin fiziki təşkili vasitələri.

    İlk iki səviyyə bütün OLAP alətlərində məcburidir. Üçüncü səviyyə, geniş istifadə olunsa da, tələb olunmur, çünki çoxölçülü təqdimat üçün məlumatlar adi əlaqə strukturlarından da götürülə bilər; çoxölçülü sorğu prosessoru bu halda çoxölçülü sorğuları əlaqəli DBMS tərəfindən yerinə yetirilən SQL sorğularına çevirir.

    Xüsusi OLAP məhsulları adətən ya çoxölçülü məlumat təqdimetmə aləti, OLAP müştərisi (məsələn, Microsoft-dan Excel 2000-də Pivot Cədvəllər və ya Knosys-dən ProClarity) və ya çoxölçülü arxa uç DBMS, OLAP serveridir (məsələn, Oracle Express Server) və ya Microsoft OLAP Xidmətləri).

    Çoxölçülü emal təbəqəsi adətən OLAP müştəri və/və ya OLAP serverində qurulur, lakin Microsoft-un Pivot Table Service komponenti kimi ən təmiz formada təcrid oluna bilər.

    Çoxölçülü məlumatların saxlanmasının texniki aspektləri

    Yuxarıda qeyd edildiyi kimi, OLAP analiz alətləri də birbaşa əlaqəli sistemlərdən məlumatları çıxara bilər. Bu yanaşma OLAP serverlərinin aparıcı verilənlər bazası təchizatçılarının qiymət siyahılarında olmadığı bir vaxtda daha cəlbedici idi. Ancaq bu gün Oracle, Informix və Microsoft tam hüquqlu OLAP serverlərini təklif edir və hətta şəbəkələrində müxtəlif istehsalçıların proqram təminatının “zooparkı” əkməyi sevməyən İT menecerləri də satın ala bilər (daha doğrusu, müvafiq sorğu ilə müraciət edə bilər). şirkətin rəhbərliyinə ) əsas verilənlər bazası serveri ilə eyni markalı OLAP serveri.

    OLAP serverləri və ya çoxölçülü verilənlər bazası serverləri öz çoxölçülü məlumatlarını müxtəlif yollarla saxlaya bilərlər. Bu üsulları nəzərdən keçirməzdən əvvəl, aqreqatların saxlanması kimi vacib bir cəhət haqqında danışmaq lazımdır. Fakt budur ki, hər hansı bir məlumat anbarında - həm müntəzəm, həm də çoxölçülü - əməliyyat sistemlərindən əldə edilən müfəssəl məlumatlarla yanaşı, aylar üzrə, kateqoriyalar üzrə satış həcminin cəmi kimi icmal göstəricilər (məcmu göstəricilər, aqreqatlar) da saxlanılır. mallar və s. Aqreqatlar sorğunun icrasını sürətləndirmək məqsədi ilə açıq şəkildə saxlanılır. Axı, bir tərəfdən, bir qayda olaraq, yaddaşda çox böyük miqdarda məlumat toplanır, digər tərəfdən, analitikləri əksər hallarda ətraflı deyil, ümumiləşdirilmiş göstəricilər maraqlandırır. İl üçün satışların məbləğini hesablamaq üçün hər dəfə milyonlarla fərdi satışı yekunlaşdırmaq lazım gəlsəydi, sürət çox güman ki, qəbuledilməz olardı. Buna görə də, məlumatları çoxölçülü verilənlər bazasına yükləyərkən bütün ümumi göstəricilər və ya onların bir hissəsi hesablanır və saxlanılır.

    Ancaq bildiyiniz kimi, hər şey üçün pul ödəməlisən. Və siz məlumatların miqdarını və onları yükləmək üçün lazım olan vaxtı artırmaqla ümumi məlumatlara sorğuların işlənmə sürətini ödəməlisiniz. Üstəlik, həcm artımı sözün əsl mənasında fəlakətli ola bilər - dərc edilmiş standart testlərdən birində 10 MB ilkin məlumat üçün aqreqatların tam sayı 2,4 GB tələb olunur, yəni məlumat 240 dəfə artıb! Aqreqatların hesablanması zamanı məlumatların "şişməsi" dərəcəsi kub ölçülərinin sayından və bu ölçülərin strukturundan, yəni ölçüsün müxtəlif səviyyələrində "atalar" və "uşaqlar" sayının nisbətindən asılıdır. Aqreqatların saxlanması problemini həll etmək üçün bəzən mürəkkəb sxemlərdən istifadə olunur ki, bu da bütün mümkün aqreqatlardan uzaq hesablamalar apararkən sorğunun icrasında əhəmiyyətli artıma nail olmağa imkan verir.

    İndi məlumatın saxlanması üçün müxtəlif variantlar haqqında. Həm təfərrüatlı məlumatlar, həm də aqreqatlar ya əlaqəli və ya çoxölçülü strukturlarda saxlanıla bilər. Çoxölçülü saxlama məlumatı çoxölçülü massiv kimi nəzərdən keçirməyə imkan verir ki, bu da hər hansı ölçülər üzrə ümumilərin eyni sürətli hesablanmasını və müxtəlif çoxölçülü çevrilmələri təmin edir. Bir müddət əvvəl OLAP məhsulları ya əlaqəli, ya da çoxölçülü yaddaşı dəstəkləyirdi. Bu gün, bir qayda olaraq, eyni məhsul həm bu növ saxlama, həm də üçüncü növ - qarışıq təmin edir. Aşağıdakı şərtlər tətbiq olunur:

    • MOLAP(Çoxölçülü OLAP) - həm təfərrüatlı məlumatlar, həm də aqreqatlar çoxölçülü verilənlər bazasında saxlanılır. Bu halda, çoxölçülü məlumatlar tamamilə əlaqəli məlumatları ehtiva etdiyi üçün ən böyük ehtiyat əldə edilir.
    • ROLAP(Relational OLAP) - təfərrüatlı məlumatlar ilkin olaraq "yaşadıqları" yerdə qalır - əlaqəli verilənlər bazasında; aqreqatlar eyni verilənlər bazasında xüsusi yaradılmış xidmət cədvəllərində saxlanılır.
    • HOLAP(Hybrid OLAP) - təfərrüatlı məlumatlar yerində qalır (relational verilənlər bazasında), aqreqatlar isə çoxölçülü verilənlər bazasında saxlanılır.

    Bu metodların hər birinin öz üstünlükləri və mənfi cəhətləri var və şərtlərdən - verilənlərin miqdarından, əlaqəli DBMS-nin gücündən və s. asılı olaraq istifadə edilməlidir.

    Məlumatların çoxölçülü strukturlarda saxlanması zamanı boş dəyərlərin saxlanması ilə əlaqədar potensial “bloat” problemi yaranır. Axı, ölçü etiketlərinin bütün mümkün birləşmələri üçün çoxölçülü bir massivdə yer ayrılıbsa və yalnız kiçik bir hissəsi faktiki olaraq doldurulursa (məsələn, bir sıra məhsullar yalnız az sayda bölgədə satılır), onda əksər yer tutsa da, kub boş olacaq. Müasir OLAP məhsulları bu problemin öhdəsindən gəlməyə qadirdir.

    Ardı var. Gələcəkdə aparıcı istehsalçılar tərəfindən istehsal olunan xüsusi OLAP məhsulları haqqında danışacağıq.

    OLAP tək bir proqram məhsulu deyil, proqramlaşdırma dili deyil və hətta xüsusi bir texnologiya deyil. Əgər siz OLAP-ı bütün təzahürlərində əhatə etməyə çalışırsınızsa, bu, analitiklərin məlumat əldə etməsini asanlaşdıran proqram məhsullarının əsasını təşkil edən konsepsiyalar, prinsiplər və tələblər toplusudur. Gəlin öyrənək Nə üçün analitiklərə xüsusi bir şey lazımdır asanlaşdırmaq məlumat girişi.

    Fakt budur ki, analitiklər korporativ məlumatların xüsusi istehlakçılarıdır. Analitikin vəzifəsi böyük məlumat dəstlərində nümunələri tapmaqdır. Buna görə də, analitik cümə axşamı dördüncü gün qara mürəkkəb partiyasının qarşı tərəf Çernova satıldığına diqqət yetirməyəcək - ona məlumat lazımdır. yüzlərlə və minlərlə oxşar hadisələr. Verilənlər bazasındakı tək faktlar, məsələn, əməliyyatın səlahiyyətində olan mühasib və ya satış şöbəsinin rəhbəri üçün maraqlı ola bilər. Bir analitik üçün bir qeyd kifayət deyil - məsələn, bir ay və ya bir il ərzində müəyyən bir filialın və ya nümayəndəliyin bütün əməliyyatlarına ehtiyac ola bilər. Eyni zamanda analitik atır alıcının VÖEN-i, onun dəqiq ünvanı və telefon nömrəsi, müqavilə indeksi və s. kimi lazımsız təfərrüatlar. Eyni zamanda, analitikin işləməsi lazım olan məlumatlar mütləq ədədi dəyərləri ehtiva edir - bu, onun fəaliyyətinin mahiyyəti ilə bağlıdır.

    Deməli, analitikə çoxlu məlumat lazımdır, bu məlumat seçici xarakter daşıyır və həm də xarakteri daşıyır” atribut dəsti - nömrə". Sonuncu o deməkdir ki, analitik aşağıdakı tipli cədvəllərlə işləyir:

    Burada " Bir ölkə", "Məhsul", "il" atributlarıdır və ya ölçmələr, A " Satışların həcmi" - beləliklə ədədi dəyər və ya ölçü. Analitikin vəzifəsi, təkrar edirik, atributlar və ədədi parametrlər arasında davamlı əlaqələri müəyyən etməkdir.. Cədvələ baxdıqda onu asanlıqla üç ölçüyə çevirmək olar: baltaların birinə ölkələri, digərinə - malları, üçüncüsü - illəri qoyuruq. Və bu üçölçülü massivdəki dəyərlər müvafiq satış həcmləri olacaqdır.

    Cədvəlin 3D təsviri. Boz seqment 1988-ci ildə Argentina üçün heç bir məlumatın olmadığını göstərir

    OLAP baxımından məhz belə üçölçülü massiv kub adlanır. Əslində, ciddi riyaziyyat nöqteyi-nəzərindən belə massiv həmişə kub olmayacaq: həqiqi bir kub üçün bütün ölçülərdə elementlərin sayı eyni olmalıdır, OLAP kublarında isə belə bir məhdudiyyət yoxdur. Bununla belə, bu detallara baxmayaraq, "OLAP kubları" termini qısalığına və təsvirinə görə ümumi qəbul edilmişdir. OLAP kubunun ümumiyyətlə 3D olması lazım deyil. Həll olunan problemdən asılı olaraq həm ikiölçülü, həm də çoxölçülü ola bilər. Xüsusilə təcrübəli analitiklər təxminən 20 ölçmə tələb edə bilər - və ciddi OLAP məhsulları məhz belə bir rəqəm üçün nəzərdə tutulmuşdur. Daha sadə masa üstü proqramları təxminən 6 ölçüsü dəstəkləyir.

    ölçmələr OLAP kubları sözdə ibarətdir işarələri və ya üzvlər. Məsələn, "Ölkə" ölçüsü "Argentina", "Braziliya", "Venesuela" və s. etiketlərdən ibarətdir.

    Kubun bütün elementləri doldurulmamalıdır: 1988-ci ildə Argentinada rezin məhsullarının satışı haqqında məlumat yoxdursa, müvafiq hüceyrədəki dəyər sadəcə müəyyən edilməyəcəkdir. OLAP proqramının məlumatları mütləq çoxölçülü strukturda saxlaması da vacib deyil - əsas odur ki, istifadəçi üçün bu məlumatlar tam olaraq belə görünür. Yeri gəlmişkən, çoxölçülü məlumatların yığcam saxlanmasının xüsusi üsulları ilə kublardakı "vakuum" (doldurulmamış elementlər) yaddaş itkisinə səbəb olmur.

    Bununla belə, kubun özü analiz üçün uyğun deyil. Üç ölçülü bir kubu adekvat şəkildə təmsil etmək və ya təsvir etmək hələ də mümkündürsə, altı və ya on doqquz ölçü ilə vəziyyət daha pisdir. Buna görə də istifadə etməzdən əvvəlçoxölçülü kubdan adi kublar çıxarılır iki ölçülü cədvəllər. Bu əməliyyat kubun "kəsilməsi" adlanır. Yenə də bu termin məcazi məna daşıyır. Analitik, sanki, onu maraqlandıran işarələrə uyğun olaraq kubun ölçülərini götürür və "kəsdirir". Bu yolla analitik kubun iki ölçülü dilimini alır və onunla işləyir. Təxminən eyni şəkildə, odunçular mişarda kəsilmiş illik üzükləri sayırlar.

    Müvafiq olaraq, bir qayda olaraq, yalnız iki ölçü "kəsilməmiş" olaraq qalır - cədvəlin ölçülərinin sayına görə. Belə olur ki, yalnız ölçü "kəsilməmiş" olaraq qalır - əgər kubda bir neçə növ ədədi dəyər varsa, onlar cədvəlin ölçülərindən birinə uyğun olaraq tərtib edilə bilər.

    Əvvəlcə təsvir etdiyimiz cədvələ daha yaxından nəzər salsanız, oradakı məlumatların, çox güman ki, ilkin olmadığını, lakin nəticədə əldə edildiyini görə bilərsiniz. ümumiləşdirmə kiçik əşyalar üçün. Məsələn, il rüblərə, rüblər aylara, aylar həftələrə, həftələr günlərə bölünür. Ölkə bölgələrdən, bölgələr isə məhəllələrdən ibarətdir. Nəhayət, şəhərlərin özündə rayonları və konkret pərakəndə satış məntəqələrini ayırd etmək olar. Məhsullar məhsul qruplarına birləşdirilə bilər və s. OLAP baxımından bu cür çoxsəviyyəli birləşmələr olduqca məntiqi olaraq adlandırılır iyerarxiyalar. OLAP alətləri istənilən vaxt iyerarxiyanın istənilən səviyyəsinə keçməyə imkan verir. Üstəlik, bir qayda olaraq, eyni elementlər üçün bir neçə növ iyerarxiya dəstəklənir: məsələn, gün-həftə-ay və ya gün-onillik-rüb. Mənbə məlumatları iyerarxiyanın aşağı səviyyələrindən götürülür və daha yüksək səviyyələrin dəyərlərini əldə etmək üçün ümumiləşdirilir. Keçid prosesini sürətləndirmək üçün müxtəlif səviyyələr üçün toplanmış dəyərlər bir kubda saxlanılır. Beləliklə, istifadəçi tərəfindən bir kub kimi görünən şey, kobud desək, daha çox primitiv kublardan ibarətdir.

    İerarxiya nümunəsi

    Bu, OLAP-ın yaranmasına səbəb olan vacib məqamlardan biridir - məhsuldarlıq və səmərəlilik. Təsəvvür edək ki, analitik məlumat əldə etməli olduqda nə baş verir və OLAP alətləri müəssisədə mövcud deyil. Analitik müstəqil olaraq (bu mümkün deyil) və ya proqramçının köməyi ilə müvafiq SQL sorğusu edir və maraq doğuran məlumatları hesabat şəklində alır və ya elektron cədvələ ixrac edir. Bununla bağlı çoxlu problemlər var. Birincisi, analitik öz işindən başqa bir iş görməyə məcburdur (SQL proqramlaşdırması) və ya proqramçıların onun yerinə tapşırığı yerinə yetirməsini gözləmək - bütün bunlar əmək məhsuldarlığına mənfi təsir göstərir, hücum, infarkt və insult səviyyəsinin artması və s. . İkincisi, tək bir hesabat və ya cədvəl, bir qayda olaraq, düşüncə nəhənglərini və rus təhlilinin atalarını xilas etmir - və bütün prosedur təkrar-təkrar təkrarlanmalı olacaq. Üçüncüsü, artıq aşkar etdiyimiz kimi, analitiklər xırda şeylər tələb etmirlər - bir anda hər şeyə ehtiyac duyurlar. Bu o deməkdir ki, (baxmayaraq ki, texnologiya sıçrayışlarla inkişaf edir) analitikin əldə etdiyi korporativ relyasiya verilənlər bazası serveri dərin və uzun müddət düşünə, qalan əməliyyatları bloklaya bilər.

    OLAP konsepsiyası məhz belə problemləri həll etmək üçün ortaya çıxdı. OLAP kubları mahiyyətcə meta-hesabatlardır. Meta hesabatları (kublar, yəni) ölçülərə görə kəsərək, analitik əslində onu maraqlandıran "müntəzəm" iki ölçülü hesabatları alır (bunlar mütləq terminin adi mənasında hesabatlar deyil - məlumat strukturlarından danışırıq. eyni funksiyalarla). Kubların üstünlükləri göz qabağındadır - verilənlərin relational DBMS-dən yalnız bir dəfə - kub qurarkən tələb edilməsi lazımdır. Analitiklər, bir qayda olaraq, tez əlavə olunan və dəyişdirilən məlumatlarla işləmədiklərindən, yaradılan kub kifayət qədər uzun müddət aktualdır. Bunun sayəsində relational DBMS serverinin işində fasilələr nəinki aradan qaldırılır (minlərlə və milyonlarla cavab xətləri olan sorğular yoxdur), həm də analitikin özü üçün məlumatların əldə edilməsi sürəti də kəskin şəkildə artır. Bundan əlavə, artıq qeyd edildiyi kimi, performans kubun qurulması zamanı iyerarxiyaların və digər toplanmış dəyərlərin subsumlarını hesablamaqla da yaxşılaşdırılır. Yəni, əvvəlcə məlumatlarımızda bir mağazada müəyyən bir məhsul üçün gündəlik gəlir haqqında məlumat var idisə, kub formalaşdırarkən OLAP tətbiqi müxtəlif səviyyəli iyerarxiyalar (həftələr və aylar, şəhərlər və ölkələr) üçün cəmi hesablayır.

    Təbii ki, bu yolla məhsuldarlığı artırmaq üçün pul ödəməlisiniz. Bəzən deyirlər ki, verilənlər strukturu sadəcə olaraq “partlayır” – OLAP kubu ilkin verilənlərdən onlarla, hətta yüzlərlə dəfə çox yer tuta bilər.

    Suallara cavab verin:

      Nə baş verdi kub OLAP?

      Nə baş verdi etiketlər xüsusi ölçü? Nümunələr verin.

      edə bilərlər tədbirlər V OLAP kubu, qeyri-rəqəm dəyərləri ehtiva edir.