pátek 10. srpna 2007

Aplikace nezávislá na databázovém systému

V poslední době se dost rozrůstá názor, že aplikace by měly být psány tak, aby byly co nejvíce nezávislé na použitém DBMS. Osobně tento názor zastávám i já.

Důvodů je několik:

  • aplikace se může natolik rozsrůst, že stávající DBMS může být nevyhovující

  • vývoj v oblasti databází jde stále vpřed a s tím souvisí i změny v SQL jazyku

  • samotný model struktury dat by měl být definován v aplikaci, kde by měl být odstíněn od nějakého SQL

  • zdroje mohou být různé (databáze, soubory, vzdálená volání, ...)

  • aplikace může být vyvíjena bez použití databáze, která může přijít v pozdější fázi



Jak už to tak bývá, tak úspěch projektu je závislý od prvotní analýzy. Nechtějme tedy vše řešit hned od počátku. Jistě je bezpečnější si nechat otevřená zadní vrátka pro dané změny, které by mohly mít fatální následky.

Kompromis

Bohužel, nežijeme v ideálním světě, kde by vše bylo nalinkované tak, jak bychom si přáli. Uvedu jeden příklad, který mě přesvědčil o tom, že vytvořit aplikaci, která by byla skutečně nezávislá na DBMS je nemožné.
Pro načítání dat z jiných zdrojů, jsem použil Timer metody z EJB3, které mají tu vlastnost, že jsem schopný vytvořit si vlastní plánování plnění. Na persistenci jsem použil JPA. Když jsem zjistil, že JPA má možnost přiřadit listener na danou entitu, hned jsem si tuto vlastnost spojil s tím, že nebudu muset psát žádné triggery a hezky půjdu touto cestou.
To jsem si ovšem neuvědomil, že při dávkovém zpracování je JPA a EntityManager natolik náročný způsob, že jsem byl nucen přejít na nízkoúrovňové JDBC. Výhodou samozřejmě bylo extrémní zrychlení, ale nevýhodou, že daný Listener je v podstatě k ničemu. Ve finále jsem byl nucen napsat trigger a tím utnout možnost, že aplikační logika se postará o vše potřebné.


Vše není tak černé

I když jsem opustil snadnou přenostitelnost, stále mi zůstává možnost psát tu aplikaci tak, aby byl doménový model to hlavní a já byl co nejvíce odstíněn od DBMS. Přece jen, toho dávkového spracování zase není tolik, aby se to nedalo kdykoli změnit.
Používám 2 základní zdroje: MySQL a Oracle. Při klasickém přístupu jsou si obě databáze velice podobné. Je zde ovšem několik rozdílů, které jsou dost zásadní. Opět uvedu příklad, který toto vystihuje:
Chci nějaký základní reportovací nástroj, který bude pracovat tak, že uživatel napíše SQL dotaz, systém ho zpracuje a vrátí tabulku. Tabulku, která bude obsahovat možnost stránkování. A zde je ten problém, stránkování. U MySQL bych šel klasicky, přes: SELECT .... LIMIT x,y. Bohužel Oracle nic takového jako LIMIT nemá. Co teď? Parsovat SQL dotaz podle použitého DBMS? Ano. Ale s tím, že někdo něco takového již napsal. Samotný EntityManager obsahuje metody "setMaxResults(int arg)" a "setFirstResult(int arg)". Takže o jednu starost méně :)

Občas mi to přijde jako věčný boj. Každý druhý (v PHP) si píše vlastní databázové layery, tvrdí jak vše funguje, ale jen do doby, než přijde první požadavek, který nebyl očekáván podle specifikace používaného frameworku.

Doufám, že jednou bude svět natolik ideální, že skutečná nezávislost bude brána jako stadard pro psaní aplikací pro DBMS.

3 komentáře:

  1. Sice pisu v .NET, ale take jsem si vytvoril DB layer nezavisly na databazovem stroji (zatim umi MySQL a MSSQL, daji se pridat dalsi), a dosud vsechno zvlada. Problem s limitem jsem mel taky, ale rekl jsem si, ze kdyz ho databaze jine nez MySQL nepodporuji, tak to nejspis nebude tak velka casova ztrata, kdyz ho neimplementuji.
    Sice layer pro vice databazi vypada jako psani do supliku, ale uz jsem ten ho opravdu vyuzil, protoze jsem jednou zjistil, ze na hostingu maji starou verzi MySQL, a proto pro me bylo jednodussi zridit si novou MSSQL databazi a rozjet CMS nad ni.

    OdpovědětVymazat
  2. Ja prave o psani vlastnich DB layeru upoustim. Duvody proc, jsou pro me vcelku jasne: potreba sledovat zmeny specifikace jednotlivych DBMS, vetsinou jiz existuje reseni, problem s ORM, atd.
    Jde o to, ze cim je reseni postaveno vys (abstraktneji), tim se take zvysuje cas, ktery server stravi samotnym prokousanim daneho frameworku. Samozrejme zalezi na kvalite. Jenze, kdyz prijde na radu davkove zpracovani, tak je nizkourovnove reseni o tolik rychlejsi, ze ho nelze ignorovat. A presne s tim jsem se setkal pri pouziti JPA vs JDBC.
    Ladeni transakci, mensich dto, atd. to vsechno je sice krasne, ale ve finale stejne pomalejsi :)

    Zajimalo by me, jak je to u .NETu, tam neexistuje nejaky primy ORM nastroj i s managerem pro DBMS?

    OdpovědětVymazat
  3. Takových aplikací podle mě moc neexistuje, respektive si nedovedu představit třeba čárové kódy, které by fungovaly bez nutnosti nějaké databáze. Prostě appka potřebuje vždycky nějakou databázi. Ať už se jedná o loginy, přístupy na internet, přístupy k informacím, hashe a další věci. Na druhou stranu ten princip, co jste popsali v článku, není nereálný.

    OdpovědětVymazat

Když programátor založí a řídí firmu

Jako malý jsem chtěl být popelářem. Ani ne tak proto, že bych měl nějaký zvláštní vztah k odpadkům, ale hrozně se mi líbilo, jak...