Robert Važan

Anki, škola a jazykové modely

Multimodálne jazykové modely (LLM) ako ChatGPT a Gemini sa dajú použiť na prípravu Anki balíčkov (decks) zo zoznamov slovíčok v učebnici cudzieho jazyka. Vďaka tomu môžete na efektívne učenie využiť intervalové opakovanie, aj keď vaša učebnica na to nebola navrhnutá. Spravili sme to takto so synom pre jeho školskú nemčinu.

Prečo sa vôbec učiť cudzie jazyky?

Mám pochybnosti o výučbe nemčiny alebo akéhokoľvek iného jazyka okrem angličtiny v školách, najmä ako povinného predmetu. Podľa mňa je angličtina jediný zostávajúci globálny jazyk. Ďalší jazyk by mohol mať zmysel, ak sa plánujete presťahovať do krajiny, kde sa ním hovorí, alebo ak máte iné špeciálne dôvody, ale podľa mňa je pre väčšinu študentov zbytočný. Riešenie, ktoré tu opisujem, však funguje aj pre angličtinu a angličtina je určite užitočná. Aj keď sa musíte učiť nejaký jazyk len preto, že je to povinný predmet, stále chcete, aby bolo vaše štúdium čo najefektívnejšie, takže tento návod by sa vám mohol hodiť.

Prečo Anki?

Anki je najpopulárnejší bezplatný a open-source systém na intervalové opakovanie (spaced repetition). Je to efektívny spôsob, ako sa učiť slovnú zásobu cudzieho jazyka. Chvíľu trvá, kým sa naučíte, ako funguje a ako ho správne používať, ale určite to stojí za to. Anki teraz podporuje algoritmus FSRS, od ktorého sa očakáva oveľa vyššia efektivita než od starého SM-2, a ktorý je v niektorých ohľadoch optimálny.

Školy intervalové opakovanie nepoužívajú

Vydavateľ učebnice mohol na svojom webe poskytnúť Anki balíčky ako doplnok k učebniciam, ale neviem o žiadnom vydavateľovi, ktorý by to skutočne robil. V školách to funguje tak, že časť slovnej zásoby sa vstrebe osmózou počas hodiny a tento prirodzený proces je náhodne prerušovaný rýchlymi testami zo slovíčok. Učiteľ pravidelne oznámi, že bude test, a študenti dostanú týždeň alebo dokonca len deň na to, aby sa naučili slovíčka na test.

Ak viete niečo o intervalovom opakovaní, pravdepodobne je vám jasné, že je to veľmi neefektívne. Na to, aby ste si dobre zapamätali slovíčka, potrebujete viac než týždeň prípravy. A ak sa takto nabifľujete pred testom, takmer všetko krátko potom zabudnete. Intervalové opakovanie pomocou Anki by fungovalo lepšie.

Čo s tým môžeme robiť?

Ako sa teda vysporiadať s neefektívnym prístupom k učeniu slovíčok, ktorý sa používa v školách? Vidím niekoľko možností:

  1. Nič nerobiť: Proste to vzdať a robiť len to, čo od vás škola očakáva. Je to hlúpo neefektívne, ale väčšina študentov to tak robí, a preto by ste za ostatnými príliš nezaostali.
  2. Štandardný balíček: Zohnať si existujúci Anki balíček z AnkiWebu, ktorý pokrýva daný jazyk. Je ich veľa a jazyk sa tak naučíte, ale vaša učebnica a váš Anki balíček nebudú zosynchronizované a vaše výsledky v školských testoch utrpia, aj keď v jazyku budete robiť skutočné pokroky.
  3. Editor balíčkov: Použiť vstavaný editor balíčkov v Anki na vytvorenie vlastného balíčka, ktorý zodpovedá vašej učebnici. Je to cielenejšie, ale je to veľa otravnej práce. Ak požiadate dieťa, aby robilo niečo takéto nudné, očakávajte, že výsledný balíček bude vyzerať trochu vtipne a bude mať chatrnú, lajdácku kvalitu, čo nie je pre učenie ideálne.
  4. Zdieľanie: Zohnať si Anki balíček, ktorý nejaký iný usilovný študent vytvoril pre vašu učebnicu a zdieľal ho online. Žiaľ, nemyslím si, že je to bežné, a pre učebnicu môjho syna som žiadne také balíčky nenašiel.
  5. Jazykové modely: Použiť multimodálne jazykové modely, ktoré vedia čítať z obrázkov, na konverziu skenov alebo fotografií zoznamov slovíčok z učebnice do Anki balíčkov, ktoré si môžete importovať do Anki. Je to rýchle a efektívne. Ak aspoň zbežne skontrolujete výstup jazykového modelu, výsledným balíčkom sa dá na 99% dôverovať.

Z týchto možností sa zdá byť najatraktívnejšia tá, ktorá využíva jazykové modely.

Použitie jazykových modelov na skenovanie zoznamov slovíčok

V učebnici môjho syna sú zoznamy slovíčok vždy na dvoch stranách. Nemali sme po ruke skener a učebnice sa do skenera aj tak dobre nevojdú, takže sme si ich jednoducho odfotili smartfónom. Súčasné jazykové modely nie sú až také inteligentné a nekvalitné skeny ich pomýlia, takže si urobte niekoľko fotiek každej strany a vyberte tú najlepšiu. Odfotenú stranu vyrovnajte. Telefón držte namierený priamo nadol. Priblížte sa čo najviac bez toho, aby ste orezali text. Uistite sa, že riadky sú takmer dokonale vodorovné. Dajte telefónu čas na zaostrenie.

Tieto fotky (dve na každý zoznam slovíčok) sme potom nahrali do ChatGPT alebo Gemini (podľa toho, ktorý mal práve voľnú kvótu) a požiadali sme jazykový model, aby nám vrátil zoznam slovíčok vo formáte, ktorý sa dá importovať do Anki. Jazykové modely poznajú formát Anki, takže im ho nemusíte vysvetľovať. Museli sme pridať inštrukcie v rozsahu približne jedného odseku, aby jazykové modely úlohu vykonali správne. Pokiaľ si pamätám, museli sme ich výslovne požiadať, aby postupovali systematicky z ľavého horného rohu strany do pravého dolného rohu a ubezpečili sa, že nevynechajú žiadne slovo. Museli sme tiež špecifikovať, čo zachovať, pretože zoznamy slovíčok v učebnici obsahovali aj príklady a iné veci, ktoré sme do Anki nechceli importovať.

Keď sme mali zoznam slovíčok v Anki formáte, už sme ho len uložili do súboru a importovali do Anki. Myslím, že sme si dokonca vytvorili špeciálny typ poznámky (note) pre slovenčinu-nemčinu, ale to nie je nevyhnutné. Štandardný typ poznámky predná-zadná strana by mal fungovať dobre. Dôležité je nastaviť Anki tak, aby každý pár slovíčok prezentoval oboma smermi pomocou dvoch typov kariet, v našom prípade slovensko-nemeckej a nemecko-slovenskej. Každý zoznam slovíčok dostal svoj vlastný balíček a tieto balíčky boli usporiadané pod spoločným nadradeným balíčkom. Lekcie sú očíslované a Anki štandardne prechádza balíčky zoradené podľa mena, takže sme len dali číslo lekcie na začiatok názvu balíčka, aby Anki prechádzal lekcie v správnom poradí. A to je všetko.

Ako používať Anki balíčky

Samozrejme, aby ste na testoch v škole dopadli dobre, musíte sa učiť slovíčka v predstihu, aby intervalové opakovanie malo čas zabrať. V septembri je to trochu problematické, pretože učebnicu dostanete až na začiatku školského roka, takže nemôžete začať s predstihom. Našťastie, väčšina učiteľov na začiatku školského roka opakuje učivo z minulého ročníka, takže budete mať týždne času pred prvým testom.

Spočítajte počet kariet v lekciách pre aktuálny školský rok. Nezabudnite, že na každé slovíčko pripadajú dve karty. Tento počet vydeľte číslom 250 a dostanete počet nových kariet, ktoré musíte denne prejsť. Prečo nie číslom 365? Pretože, samozrejme, všetko musíte vedieť pred posledným testom v danom školskom roku. Možno budete musieť na začiatku školského roka, približne na mesiac, zvýšiť denný počet nových kariet, aby ste si vytvorili náskok.

Nie sú jazykové modely nespoľahlivé?

Áno, sú. Musíte skontrolovať výstup, či neobsahuje hrubé chyby, ako je vynechanie celej skupiny slovíčok alebo nesprávne spárovanie dvojíc slovíčok medzi stĺpcami kvôli krivo odfoteným riadkom. Okrem toho musíte zoznam slovíčok zbežne prejsť, aby ste sa uistili, že väčšina dvojíc je správna.

Môžete takto niečo prehliadnuť, ale tieto krátke kontroly stačia na to, aby ste si boli istí, že zoznam slovíčok je aspoň na 99% správny. Mať 1% chybovosť v zozname slovíčok nie je pri učení jazyka problém, pretože oveľa vyššiu chybovosť máte kvôli zabúdaniu. Určite je to kvalitnejšie než balíčky, ktoré si ručne vytvárajú študenti. A z 99% správneho Anki balíčka sa naučíte viac než bifľovaním pred testom ako to od vás očakáva škola.