Robert Važan

Európske API pre jazykové modely

Skúmal som európske cloudy, ktoré ponúkajú API na inferenciu jazykových modelov (LLM). Nákup od európskych poskytovateľov znižuje riziko krádeže duševného vlastníctva skrz jazykové modely, minimalizuje riziko amerického a čínskeho špehovania a zasahovania a poskytuje praktický medzikrok pred prechodom na lokálne modely. Tento článok je len prehľad ponúk. Žiadnu z nich som zatiaľ reálne netestoval.

Mistral

Jasnou prvou zastávkou je Mistral, francúzska spoločnosť, ktorá trénuje vlastné modely. Sú slabšie než najlepšie americké modely, ale tiež lacnejšie. Otravné je, že ceny v eurách sú rovnaké ako v dolároch, takže pri aktuálnom kurze zaplatíte v eurách asi o 15% viac. Mistral ponúka zaujímavé modely uvedené nižšie. Ceny sú za 1M vstupných/výstupných tokenov.

Keďže ani najlepší model od Mistralu nie je konkurencieschopný voči najlepším open-source modelom, budem sa musieť poobzerať po európskych API, ktoré ponúkajú open-source modely. Mistral sám takú službu neponúka.

Scaleway

Scaleway je francúzska cloudová spoločnosť, ktorá ponúka LLM API pre širokú paletu open-source modelov za atraktívne ceny. Najlepší model, ktorý aktuálne ponúkajú, je qwen3-235b-a22b za €0.75/€2.25. Všimnite si nízky pomer 1:3 medzi cenou vstupu a výstupu. Mnohé modely majú pomer 1:1. To naznačuje určitú neefektivitu v ich inferenčnom jadre. Podobne prekvapia aj nezvyčajne nízke limity na počet výstupných tokenov.

OVHcloud

OVHcloud je ďalšia francúzska cloudová spoločnosť. Má službu AI Endpoints, teda API pre jazykové modely. Je k nej cenník, ale ponuka mi príde dosť obmedzená. Najväčší model je len Llama 3.3 70B a príslušný DeepSeek fine-tune. Cena vstupných aj výstupných tokenov je rovnaká, €0.67 pre Llama 3.3 70B. Dúfam, že službu časom rozšíria.

Nscale a Nebius

Tieto dve firmy nie sú úplne európske. Nscale má kancelárie v Londýne, aj keď dátové centrá sú v kontinentálnej Európe. Nebius sídli v Amsterdame, no vo vedení má viacerých Rusov vrátane riaditeľa. Obe firmy však ponúkajú niečo, čo Scaleway ani OVHcloud nemajú. Nscale ponúka GPT OSS 120B za $0.10/$0.40. Nebius ponúka DeepSeek R1 0528 za $0.80/$2.40.

Čo ďalej?

Podľa mňa je najvyšší čas presunúť ľahšie úlohy do európskych cloudov. Aj ja tak plánujem spraviť. Najsľubnejšie vyzerajú Mistral Medium a Qwen 3 235B A22B od Scaleway. Schopnosti modelov rýchlo rastú a s nimi porastie aj použiteľnosť európskych API pre jazykové modely. Európske cloudy ale nemôžu zvládnuť ťažké úlohy, ako je programovanie, kým neponúknu špičkové modely.