Robert Važan

Prečo vypchávanie kontextu?

Dve najpopulárnejšie metódy na naplnenie kontextového okna jazykových modelov (LLM) sú RAG a agenti. Ja som však veľkým fanúšikom vypchávania kontextu (context stuffing). Vypchávanie kontextu sa snaží načítať čo najviac informácií, ideálne všetko, čo je k dispozícii, do kontextového okna ešte pred začiatkom generovania textu.

Vypchávanie kontextu má niekoľko výhod:

Niektorí ľudia sa obávajú, že preplnenie kontextu jazykový model rozptýli, ale premýšľajúce jazykové modely si vždy môžu presunúť relevantné časti kontextu na koniec, kde je pozornosť jazykového modelu najsilnejšia. Ak by som mal poukázať na skutočnú slabinu vypchávania kontextu, boli by to veľké projekty. Načítavanie založené na pravidlách (nedávne, spomenuté, kľúčové a súvisiace súbory) sa stáva neefektívnym, keď kontext tvorí len malý zlomok celkovej veľkosti projektu. Pre veľké projekty je efektívnejšie použiť agentické načítavanie. Určité množstvo vypchávania kontextu však stále pomáha.