Elmélet kategória bejegyzései

Üzleti logika a tárolt eljárásban

Sokat feszegetett kérdés, két szélsőséges nézettel:

  • Az üzleti logikát soha nem tesszük SQL-be, mert …
  • Az üzleti logikának az SQL-ben a helye, mert …

Több éve fejlesztek üzleti logikában gazdag és üzleti logikát mellőző adatbázisokat is.
Ez idő során az alábbi előnyökkel és hátrányokkal találkoztam.

Előnyök:

  • Biztonságosabb:
    • Nincs SQL injection
    • Csak azokhoz az adatokhoz fér hozzá az alkalmazás, amit a tárolt eljárás visszaad
  • Kevesebb SQL hívás, összesítve kisebb erőforrás használat:
    • Több SQL hívást egy tárolt eljárás le tud futtatni. Pl olyan hívás, amit egy select-el nem szolgálható ki.
  • Rövidebb, szerver oldali tranzakciók:
    • Egyik alaptétel, hogy egy tranzakció legyen olyan rövid, amennyire csak lehet. A kliens oldalon indított tranzakció sosem lesz olyan rövid, mint a szerver oldalon indított.
  • Csak azok az adatok hagyják el az adatbázis szervert, amire szükség van
    • Az érzékeny adatok, mint pl. jelszavaknak soha nem kell kikerülnie az DB szerverről
  • Nem kell az alkalmazás fejlesztőnek az adatbázissal vesződnie:
    • Megkapja az adatot és dolgozik vele
    • Nem kell sémákat terveznie, megteszi az, aki ezt jobban tudja

A fentiek közül szerintem a biztonság és a teljesítmény a legnagyobb előnyei.

Hátrányok:

  • Egy modern nyelvhez képest szegényes a T-SQL:
    • Nincsenek osztályok, tömbök, stb.
  • Körülményesebb a verziókezelés:
    • SQL szerverre egy verziókezelőt sokkal bonyolultabb és drágább ráépíteni, mint egy mai modern programozási nyelvre
  • A fejlesztési idők lassulhatnak:
    • Mivel a nyelv szegényes, így nehezebben olvasható kódok születnek
  • Kevesebb az SQL fejlesztő, nehezebb pótolni őket:
    • Értelemszerűen, mivel kisebb a piaca ennek a szakmának, így kevesebb munkaerőt találni
    • Mivel kevesebb a fejlesztő, így hamarabb lesz a fejlesztő a szűk keresztmetszet, mint a DB szerver. Viszont, ha nincs SQL fejlesztő, akkor hamarabb lesz a DB a szűk keresztmetszet
  • Adatbázis szervert skálázni körülményesebb és drágább, mint egy alkalmazás szervert
  • Nehezebb az alkalmazást átmigrálni egy másik adatbázis kezelőre
  • Többnyire csak az SQL fejlesztők tudják, hogy mi történik egy-egy tárolt eljárás hívása során

A fentiek közül szerintem a kisebb munkaerő piac és az esetleges fejlesztési idő megnövekedése a legnagyobb hátrányai.

 

Nincs minden teljesen úgy, ahogy fentebb írtam

Ilyen pl, amikor azt írtam, hogy a T-SQL nyelvezete szegényesebb. Ugyanis az SQL szerver lehetővé teszi, hogy pl: C# kódot használjunk CLR integrációval. Egy CLR módosítása viszont újabb problémákat vet fel, ezért ezzel és az ehhez hasonló a ténnyel egyszerűsítettem az előnyök és hátrányok során.

 

Mindenki használ üzleti logikát SQL-ben, ilyeneket mint:

  • NOT NULL constraint
  • Foreign key constraint
  • Unique constraint
  • Check constraint

Ne feledjük, hogy a triggerek, function-ök is hordozhatnak üzleti logikát, ami szintén SQL.

Jellemző még, ha SQL-ben a logika, akkor SQL-t kell optimalizálni, ha alkalmazásban, akkor alkalmazást teljesítmény problémák esetén. Ha keresztbe kell optimalizálni, akkor ott valami jó eséllyel rosszul van tervezve.

 

A nagy kérdés, hogy hol jobb a logika?

Szerintem ez nem olyan fekete-fehér szituáció, ahol egyértelműen ki lehet jelenteni, hogy A vagy B helyen, ezért is lehet ez hitvita kérdése. Mindenki az fogja fújni, amelyik részen fejlesztett, vagy amivel jobb tapasztalata van. Ami viszont biztos, hogy ha megkérdezek két embert, hogy szerinte mi az üzleti logika, más magyarázatot adnak rá.

Én azt gondolom, hogy erősen alkalmazás függő, hogy A, B, esetleg mindkét hely jó lehet. Pl.: egy számlázó rendszerben a tárolt eljárásokban tökéletes helye van az üzleti logikának.

 

Ha a tárolt eljárásban van az üzleti logika, akkor kell e API szerver? Lehet e az adatbázis szerver az API réteg is egyben?

Nekem az a tapasztalatom, hogy kell API szerver, mert:

  • Tud (elő)validálni input adatokat
  • Át tudja alakítani a tabuláris adatokat a megfelelő formára (pl.:JSON, amit a fejlesztők nagyon szeretnek. Bár SQL 2016-tól támogatott a JSON kimenet, meg van CLR is, de ezektől most tekintsünk el)
  • Ha elosztott adatbázisokból kell adatokat kikérni, akkor összefésülheti azokat a megfelelő formára

 

Reklámok

A nagy, a sok és a konkurencia

A fenti 3 dologban közös, hogy mindhárom ellensége a DBA-nak. Ahhoz, hogy tartósan megfelelően működjenek a szerverek, a fenti dolgokat figyelembe kell venni. Bár relatív fogalmak, mert függ a hardvertől is, hogy mikor érik el a kritikus szintet, de amelyik alkalmazás fejlődik ott figyelni kell ezekre.

Nézzük sorra, hogy melyik hol gond:

Nagy méret: (Ami nagy lesz az gond lesz, csak idő kérdése)

  • Nagy méretű adatbázisok: Minél nagyobb az adatbázis mérete, annál tovább tartanak rajta a karbantartási, mentési, helyreállítási műveletek, annál több hely kell a backup-oknak. Jó megoldás az adatbázisok elosztása. Pl.: Készül egy archív adatbázis a product adatbázis mellé, ahova az archive adatok kerülnek.
  • Nagy méretű táblák, indexek: Ezekben az esetekben is a karbantartási műveletek (pl: index rebuild, index reorganize, update statistics) kerülnek sok időbe. Célszerű darabolni a táblát (pl.: partition).

Sok: (Amiből sok lesz, az gond lesz, csak idő kérdése)

  • Sok sor: Minél több egy táblában a sor, annál mélyebbek lesznek az indexek, több lépésből tart megtalálni egy-egy sort is. A particionálás ebben az esetben jól jöhet.
  • Sok nyitott kapcsolat: Minden kapcsolat plusz erőforrásba kerül a szervernek. Amikor kezd kritikussá válni a mennyisége, akkor célszerű új szervereket beállítani a kiszolgálásba.
  • Sok utasítás egységnyi idő alatt: Amikor sok utasítás érdekezik be egységnyi idő alatt, akkor célszerű felülvizsgálni az alkalmazás(oka)t, mert lehet kódhibáról van szó, de az is lehet, hogy DML utasítások helyett a tárolt eljárás a nyerő. Egyéb esetben meg új szervereket célszerű beállítani a kiszolgálásba.

Konkurencia: (Ami konkurál egymással az össze fog akadni, csak idő kérdése)

  • Tranzakciós lock: Ezek a lock-ok a válaszidőket növelik meg. Márpedig a gyors válaszidőket jobban szeretjük. Ehhez vagy jól tervezzük az adatbázisokat és vele az alkalmazást is, vagy átnyargalunk az in-memory technológiára, ha van rá lehetőségünk.

 

A problémákra az ajánlások általános ajánlások, lehet másképp is megoldani, erősen esetfüggő.

Tárolt eljárás: hol és miért jobb?

A tárolt eljárásokat az SQL szerver tárolja és futtatja. Ahhoz, hogy el tudjuk dönteni szükségünk van e rá, nézzük meg milyen előnyei vannak:

  • Biztonság
  • Teljesítmény

Ha az alkalmazás tervezésekor már látszik, hogy fentiek közül valamelyik sokkal többet nyom a latba, mint az egyéb követelmények, akkor érdemes elgondolkodni rajta. Ebben a post-ban az első pontról fogok írni.

Biztonság:

A tárolt eljárás attól ad nagy biztonságot, hogy a user annak futtatására kapja a jogot és nem a táblákra (select, insert, update, delete jogokat). Ezzel a tipikus SQL injection kizárva.

Akkor is nagyon hasznos, amikor már betörtek az alkalmazás szerverekre és ellopták az adatbázis kapcsolat konfigurációs (felhasználó, jelszó, stb) fájljait. Ekkor a tárolt eljárások futtatására lesz joga a támadónak és nem pl egy “SELECT * FROM jelszavak;” parancs futtatására. A tárolt eljárás pedig mindig azt adja vissza, amit beleprogramoztunk. Eddig tudott minket védeni az SQL szerver, innen jövünk mi.

Hol tudjuk ezt a gyakorlatban nagyon jól használni? Pl.: Ott, ami most is az orrunk előtt van, a weben :). Ha van egy webalkalmazásunk, akkor az egész világnak esélyt adunk rá, hogy feltörje azt.

Legyen is egy ilyen webalkalmazásunk, ahol be tudnak login-olni a usereink. Tételezzük fel, hogy tárolt eljárásaink vannak. A támadó bejutott a webszerverre (az adatbázis másik fizikai szerveren van), ellopta az alkalmazás logikáját, tudja futtatni a tárol eljárásainkat. Idővel kitalálja, hogyan kell őket paraméterezni, hogy el tudja lopni pl.: a felhasználó / jelszó párosokat. Már ezzel is sokat nyertünk, de itt lenne a vége, ennyire futotta? Közel sem! Nézzük meg egy példán keresztül mit tehetünk még!

A rosszul megírt eljárás bekéri a user azonosítóját, visszaadja az adatait, majd az alkalmazás elvégzi a hitelesítést:

create procedure usp_user_get_by_id
	@user_id int
as
begin
	set nocount on;
	
	select
		user_name,
		password,
		create_date
	from users
	where user_id = @user_id
end
go

 

A jól megírt eljárás elvégzi a hitelesítést majd visszaadja az adatokat:

create procedure usp_user_get_by_id_password
	@user_id int,
	@password varchar(64)
as
begin
	set nocount on;
	
	select 
		user_name,
		create_date
	from users
	where user_id = @user_id
		and password = @password
	
end
go

 

Mindössze annyi történt, hogy a logika átkerült az alkalmazásból az adatbázisba. Így az érzékeny adatnak nem kellett elhagynia az adatbázis szervert. Ezzel tehát még egy védelmi falat húztunk fel. És ehhez semmi nagy varázslat nem kellett, csak szem előtt tartani, hogy a biztonság a legfontosabb az alkalmazásunkban.

Tehát ami védett: tárolt eljárás + a logika az sp-ben volt.

A logika a tárolt eljárásban egyébként is egy izgalmas téma, vannak nagyon jó felhasználási területei, ma bemutattam egyet.