Trendovi · · 7 min

RAG ili fine-tuning: što odabrati za bazu znanja vaše firme

RAG ili fine-tuning? Vodič za HR tvrtke koje žele AI koji razumije njihov specifičan kontekst. Razlika, troškovi i decision framework bez tehničkog žargona.

Pitanje koje dobivamo svakih nekoliko tjedana: “Trebamo AI koji razumije naše dokumente i procese. Trebamo li fine-tunirati model ili koristiti RAG?”

Kratki odgovor: za 90% slučajeva u malim i srednjim hrvatskim tvrtkama, RAG je pravi izbor. Dugi odgovor je zanimljiviji - razumijevanje razlike između ova dva pristupa direktno određuje koliko ćete platiti, koliko ćete čekati, i hoće li cijeli sustav raditi za godinu dana kad se vaši podaci promijene.

Evo praktičnog vodiča.

Što je RAG - bez tehničkog žargona

RAG (Retrieval-Augmented Generation) funkcionira ovako: kad postavite pitanje AI-u, sustav prvo pretražuje vašu bazu dokumenata, pronalazi relevantne dijelove, i šalje ih zajedno s pitanjem AI modelu. Model zatim odgovara koristeći taj kontekst - ne iz memorije, nego iz konkretnih dokumenata koje je upravo vidio.

Analogija: zamislite odvjetnika koji ima stotine presuda u ormaru. Kad klijent postavi pitanje, odvjetnik izvuče 3-4 relevantne presude, pročita ih i odgovori na temelju toga. RAG radi isto - samo bez fizičkog pretraživanja. Ručna pretraga sudske prakse u bazi od 225.000 dokumenata može trajati 3+ sata. Isti upit u RAG sustavu: manje od 5 minuta.

LexBox, pravni AI asistent za odvjetničke urede, radi po ovom principu. Njegova baza sadrži 225.000+ hrvatskih i EU pravnih dokumenata. Kad odvjetnik postavi upit, sustav u sekundama pronalazi relevantne zakone i sudsku praksu te generira odgovor na temelju toga. Model nije “naučio” zakone napamet - on ih svaki put čita iz baze i daje odgovor s referencama.

Ključna prednost RAG-a: bazu možete ažurirati u bilo kojem trenutku. Novi zakon stupi na snagu? Dodate dokument. Nema ponovnog treniranja modela, nema čekanja, nema dodatnih compute troškova.

Ključni nedostatak: RAG je toliko dobar koliko je dobra vaša baza i retrieval logika. Ako dokumenti nisu dobro strukturirani ili baza nije ispravno indeksirana, sustav će pronaći krive odgovore ili nikakve. Implementacija zahtijeva pažnju na kvalitetu podataka - to je posao koji morate odraditi jednom, ali ga morate odraditi dobro.

RAG nije nova tehnologija. Koriste je pretraživači, pravni sustavi, medicinska dokumentacija. Ono što je novo je cijena i dostupnost - prije 3 godine izgradnja RAG pipeline-a zahtijevala je tim od nekoliko developera i tjednima rada. Danas to može biti implementirano za tjedan do dva, uz gotove alate i jasno definiran proces.

Što je fine-tuning - i zašto nije odgovor na sve

Fine-tuning je drugačiji pristup: uzimate postojeći AI model i trenirate ga dodatno na vašim podacima. Model “usvoji” vaš stil pisanja, terminologiju, specifičan format odgovora - to postaje dio njega, ne kontekst koji mu dajete.

Primjer gdje fine-tuning ima smisla: customer support bot koji uvijek odgovara točno u tonu vaše marke, s vašom terminologijom, bez da svaki put dobiva posebne upute. Model je “zapamtio” kako pisati.

Ali postoje dva problema koja se često previde.

Fine-tuning ne rješava faktualnost. Model može naučiti ton i format, ali ne može “znati” što je napisano u dokumentu koji nije vidio za vrijeme treniranja. Ako vaš pravilnik o reklamacijama kaže 14 dana, a trebate da chatbot to točno prenosi klijentima - fine-tuning to ne garantira. RAG to rješava jer svaki put čita aktualni dokument.

Fine-tuning ima rok trajanja. Kad se vaši podaci promijene - novi cjenik, nova politika, promijenili ste organizacijsku strukturu - morate ponovo trenirati model. Svaka runda treniranja košta compute resurse, traje tjednima i zahtijeva pripremu podataka. Firme koje se ne pripreme na taj trošak završe s modelom koji govori zastarjele informacije.

Konkretne situacije: kad koji pristup

Ova dva pristupa nisu isključivi - mogu se kombinirati. Ali za početnu odluku, evo praktičnih smjernica:

Koristite RAG kada:

  • Imate dokumente koji se mijenjaju - cjenici, propisi, interna dokumentacija, FAQ
  • Trebate da sustav pronalazi specifične informacije i može citirati izvor
  • Radite s velikom bazom dokumenata (od nekoliko stotina do stotina tisuća)
  • Transparentnost je važna - morate znati odakle dolazi odgovor, posebno u reguliranim industrijama
  • Budžet je ograničen i trebate rješenje brzo

Razmotrite fine-tuning kada:

  • Trebate model koji uvijek piše u specifičnom stilu ili formatu - automatski, bez posebnih uputa za svaki upit
  • Radi se o zadatku koji ne ovisi o ažurnim informacijama: klasifikacija teksta, transformacija formata, ekstrakcija strukturiranih podataka
  • Vaš skup podataka za treniranje je stabilan i rijetko se mijenja
  • Imate tehničke kapacitete za ponavljano treniranje ili koristite manji open-source model na vlastitom hardveru

Primjer za računovodstveni servis: žele AI koji razumije interne pravilnike i može odgovoriti zaposlenicima na pitanja poput “koji dokumenti su potrebni za prijavu poreza na dohodak od samostalne djelatnosti?” - RAG. Dokumenti se mijenjaju, odgovor mora biti točan i citiran.

Primjer za marketing agenciju: žele AI koji piše opise proizvoda uvijek u glasnom i specifičnom tonu marke, bez da svaki put pišu dugačak prompt o stilu - fine-tuning ili kombinacija s RAG-om za aktualne informacije o proizvodu.

RAG vs. fine-tuning usporedba

Troškovi i vremenski okvir

Ovaj dio se najčešće preskače u razgovorima o AI strategiji - a upravo ovdje leži razlika između dobre i loše odluke.

RAG implementacija:

Setup uključuje embedding pipeline (pretvaranje vaših dokumenata u format koji AI može pretraživati), vector bazu i retrieval logiku. Jednom postavljeno, ažuriranje baze je jeftino i brzo - ne zahtijeva tehničku intervenciju od vas.

Tekući troškovi su API pozivi za AI model i hosting baze, što za tipičnu SME implementaciju iznosi od nekoliko stotina eura mjesečno. Klapa Workflow paket koji uključuje RAG implementaciju kreće od 2.500 EUR setup-a.

Fine-tuning implementacija:

Treniranje modela zahtijeva značajne compute resurse. Jedna runda fine-tuning-a na manjim open-source modelima (LLaMA, Mistral klase) može koštati od nekoliko tisuća eura samo u compute troškovima, uz pripremu podataka i evaluaciju. Za GPT-4 klase modele - višestruko više.

Svaka promjena podataka zahtijeva ponovnu rundu. Za firme s dinamičnim podacima, godišnji trošak ponavljanog fine-tuning-a može premašiti 20.000 EUR - bez da ste dobili fundamentalno bolji sustav od kvalitetnog RAG-a.

Vremenski okvir:

RAG sustav može biti živ za 2-4 tjedna od početka rada, ovisno o veličini baze i složenosti integracija. Klapa isporučuje prve rezultate unutar 14 dana od potpisa. Fine-tuning projekti rijetko stanu ispod 2-3 mjeseca uključujući pripremu podataka, treniranje, evaluaciju i popravljanje grešaka.

Za firmu koja želi vidjeti poslovni rezultat brzo - RAG je jedini razumni početak.

Decision framework za vašu firmu

Tri pitanja koja vrijedi postaviti sebi:

Je li problem “znanje” ili “stil i format”?

Ako problem je “AI ne zna naše specifičnosti, pravilnike, cjenik, prošlost naših projekata” - to je problem znanja. RAG.

Ako problem je “AI ne piše na naš specifičan način, u našem formatu” - to je problem stila. Fine-tuning ili prompt engineering (koji je puno jeftiniji od fine-tuning-a i vrijedi isprobati prvi).

Koliko se često mijenjaju vaši podaci?

Tjedne promjene ili barem mjesečne promjene? RAG.

Godišnje ili rjeđe, s malom bazom primjera? Fine-tuning potencijalno ima smisla.

Trebate li transparentnost - “odakle dolazi taj odgovor”?

RAG daje citate i reference na konkretne dokumente. Fine-tuning model generira odgovore bez eksplicitnog referenciranja izvora.

Za regulirane industrije - pravo, zdravstvo, financije, javni sektor - transparentnost izvora nije opcija, nego zahtjev. RAG je gotovo uvijek bolji izbor.

Jedno opće pravilo: počnite s RAG-om. Možete ga nadograditi fine-tuning-om ako se pokaže da trebate specifičan stil ili format na vrhu. Suprotni redoslijed je puno skuplji i teži.

Za dublji uvid u to kako AI upravljanje znanjem funkcionira u praksi, pogledajte i post o tome kako koristimo AI za upravljanje znanjem u firmi.

Gdje dalje

Ako razmišljate o AI-u koji razumije vaše dokumente i procese, ali niste sigurni koji pristup odabrati, zakažite besplatni 30-minutni audit. U roku 48 sati dobijete pisani mini-audit s konkretnim prijedlogom za vašu situaciju - uključujući preporuku između RAG-a, fine-tuning-a ili kombinacije.

Želite automatizirati procese u vašoj tvrtki?

Besplatni AI audit traje 30 minuta. Identificiramo vaša top 3 procesa za automatizaciju i kažemo vam koliko možete uštedjeti.

Zakažite besplatni audit
← Svi članci