Minden cégnél ott ül egy néma tudásbázis: szerződések, jegyzetek, ajánlatok, belső doksik, e-mailek. Megvan az információ — csak megtalálni nem lehet. A klasszikus megoldás a felhős AI-keresés (OpenAI, Pinecone és társai), de itt jön a csapda: a bizalmas céges anyagot nem akarod (és sokszor nem is szabad) feltölteni egy külső szolgáltatóhoz.
Ez a blueprint a kettő közötti hidat írja le: teljes értékű, szemantikus dokumentumkeresés, ami soha nem hagyja el a gépet. Ugyanaz a rendszer, ami a saját, teljes /Users/barna munkakönyvtáramat indexeli és kereshetővé teszi — felhő, API-kulcs és havidíj nélkül.
Milyen problémát old meg
- „Tudom, hogy leírtam valahol" — a hibrid keresés egyszerre talál kulcsszóra (pontos egyezés) és jelentésre (szemantikus), így akkor is megtalálja, ha más szóval kerested.
- Adatszivárgás-kockázat — a bizalmas anyag nem megy OpenAI-ba, nem megy felhőbe, nem kerül be senki más tanítóadatába.
- Növekvő API-számla — a beágyazás (embedding) helyben fut, így a keresés 0 Ft folyó költség, akárhányszor használod.
Mennyit ér
Az érték kettős: megtalálhatóság + adatvédelem, kompromisszum nélkül. Egy ügyvédi iroda, egészségügyi szolgáltató vagy bármilyen NDA-val dolgozó cég így kaphat AI-szintű keresést anélkül, hogy bármilyen bizalmas anyag elhagyná a saját infrastruktúráját.
A saját rendszeremben ez konkrétan 775 fájlt, 1820 keresési egységre (chunk) bontva indexel, helyi beágyazó-modellel (all-MiniLM-L6-v2, 384 dimenzió). A teljes index újraépítése ~18 másodperc, és 0 Ft API-költséggel fut, akárhány keresésnél.
Mikor éri meg bevezetni
- Ha sok dokumentumod van, és a keresés most „emlékszem, hogy valahol…" alapon megy.
- Ha bizalmas / szabályozott anyaggal dolgozol, ami nem mehet felhőbe.
- Ha egy AI-asszisztenst akarsz a saját anyagaidra alapozni (RAG), de a felhős út kizárt.
Mikor NE
Ha a doksijaid már egy jól kereshető rendszerben vannak (pl. egy rendesen címkézett Notion/Confluence, amiben tényleg megtalálsz mindent), és nincs adatvédelmi kifogásod a meglévő kereső ellen — akkor ez fölös réteg. Ugyanígy, ha pár tucat fájlról van szó: azt egy mappa-struktúra + sima szövegkeresés is lefedi. A lokális RAG akkor nyer, ha a mennyiség + a bizalmasság együtt áll fenn.
Milyen döntéseket kell meghoznod
- Mit indexelsz — mely mappák, milyen fájltípusok. Kezdd a sűrűn keresett, magas értékű anyaggal.
- Milyen darabolás — a dokumentumokat „chunk"-okra bontod (nálam ~2000 karakteres, átfedéssel), hogy a keresés a releváns részletet adja vissza, ne az egész fájlt.
- Hogyan futtatod — egyszeri CLI-keresés, vagy egy mindig futó háttér-daemon, ami milliszekundumos választ ad. Heti automatikus újraépítés ütemezve.
Ha tovább mennél — a technikai váz
Ez már annak szól, aki maga (vagy a csapatával) be is állítaná. A rendszer lokális, hibrid retrieval elven működik, és teljesen platform-független:
- Dokumentum-beolvasás — a kijelölt mappák bejárása, a támogatott fájlok (Markdown, szöveg, README-k) tartalmának kiolvasása.
- Darabolás (chunking) — minden dokumentum struktúra-tudatos darabokra bomlik (kb. 2000 karakter, ~200 karakter átfedéssel), hogy a kereső a pontos részletet adja vissza.
- Helyi beágyazás (embedding) — minden darabot egy lokálisan futó modell (
all-MiniLM-L6-v2, 384 dimenzió) vektorrá alakít. Nincs külső API-hívás — a modell egyszer letöltődik (~90 MB), aztán offline fut. - Hibrid index — két index épül egyszerre: egy FAISS vektor-index (jelentés-alapú, szemantikus keresés) és egy BM25 kulcsszó-index (pontos egyezés). A találatok RRF-fel (reciprocal rank fusion) egyesülnek — így a kulcsszó és a jelentés ereje összeadódik.
- Keresés — egy CLI vagy egy könnyű háttér-daemon (helyi porton) fogadja a lekérdezést, és a hibrid indexből adja a legrelevánsabb darabokat — tipikusan milliszekundumok alatt, teljesen helyben.
- Heti újraépítés — egy ütemezett folyamat (cron / launchd) frissíti az indexet, hogy az új dokumentumok bekerüljenek.
A részletes, importálható változatot (indexelő + chunker + hibrid kereső sablon) most állítom össze. A feliratkozás korai hozzáférést ad: szólok, amint kész — addig is, ha a saját céges tudásod lokális kereshetővé tételére vagy kíváncsi, beszéljünk egy fél órát.
Élesítéskor érdemes figyelni: a chunk-méretet a saját anyagodra hangold (rövid doksinál kisebb); a beágyazó-modellt a géped erőforrásához válaszd (a MiniLM kis és gyors, de van pontosabb is); és az indexet rendszeresen építsd újra, különben az új doksik kimaradnak a keresésből.
A teljes blueprint feliratkozás után érhető el.
Add meg az email-címed, és azonnal feloldódik a teljes blueprint. A részletes, importálható változatot (workflow-export + sablonok) most állítom össze — feliratkozóként korai hozzáférést kapsz rá, amint elérhető. CC BY 4.0, vidd, ha hasznos. Nincs spam.