Místní umělá inteligence s MLX na Macu - Praktický průvodce pro Apple Silicon

V době, kdy na titulních stránkách novin dominují centralizované služby AI, jako jsou ChatGPT, Claude nebo Gemini, roste u mnoha profesionálních uživatelů potřeba alternativy - lokální, samostatně ovladatelné infrastruktury AI. Zejména v případě kreativních procesů, citlivých dat nebo opakujících se pracovních postupů je lokální řešení často udržitelnější a bezpečnější variantou.

Každý, kdo pracuje s počítačem Mac - zejména s Apple Silicon (M1, M2, M3 nebo M4) - může nyní najít úžasně výkonné nástroje pro spouštění vlastních jazykových modelů přímo v zařízení. Jejich středobodem je nová, do značné míry neznámá komponenta: MLX, framework pro strojové učení vyvinutý společností Apple, který bude v příštích letech pravděpodobně hrát v ekosystému umělé inteligence společnosti stále větší roli.

Aktuální články o umělé inteligenci

Naučit se myslet v dialogu s umělou inteligencí: Proč jsou dobré otázky důležitější než dobré modely

Nesmrtelnost díky technologiím: jak daleko se výzkum a umělá inteligence skutečně dostaly

Od obsahu k podstatě: jak vznikají digitální systémy, které nelze kopírovat

Vývoj softwaru s využitím umělé inteligence

Vývoj softwaru s Codexem, ChatGPT a umělou inteligencí: Praktický průvodce pro vývojáře

Nejnovější zprávy o MLX a Ollama

02.05.2026: Aktuální video se tématu věnuje podrobněji a podrobně kategorizuje nejdůležitější odvozovací motory. Je zřejmé, že rozhodující není jen samotný model, ale především „engine“, který za ním stojí - tedy engine, který řídí výpočet, přístupy do paměti a komunikaci. Srovnání Ollama, MLX, llama.cpp a vLLM ukazuje, jak se výkon a oblasti použití mohou v závislosti na hardwaru a cílech značně lišit. Úloha MLX na zařízeních Apple-Silicon je obzvláště zajímavá, protože díky této architektuře je zde možné dosáhnout nového zvýšení efektivity. Zároveň je zřejmé, že neexistuje žádné univerzální řešení: V závislosti na scénáři - lokálním, serverovém nebo škálovacím - mají smysl různé motory. Video proto přidává k současnému vývoji MLX důležitou strategickou perspektivu.

Podívejte se na toto video na YouTube

Ollama, MLX, llama.cpp nebo vLLM? Jak vybrat motor pro VAŠE UI! | Giorgi Lomidze

30.03.2026: S aktuální verze náhledu Ollama poprvé integruje rámec MLX Apple jako backend pro počítače Mac Apple-Silicon. Cílem je výrazně zrychlit místní umělou inteligenci a lépe využít hardware. MLX využívá sjednocenou paměťovou architekturu moderních Maců, která umožňuje efektivní sdílení dat mezi CPU a GPU bez neustálého kopírování. Výsledkem je znatelné zlepšení „time to first token“ a rychlosti generování.

První benchmarky a zprávy hovoří o výrazném nárůstu výkonu díky výrazně vyššímu počtu tokenů a efektivnějšímu využití paměti. Video, na které odkazujeme v článku, jasně ukazuje, proč je tato změna tak důležitá: předchozí zásobník llama.cpp je nahrazen zásobníkem MLX, takže lokální umělá inteligence na Macu je poprvé skutečně plynulá a vhodná pro každodenní použití. Funkce zároveň zůstává preview, takže je třeba počítat s omezeními a dalšími optimalizacemi. Celkově tento krok znamená důležitý přechod k rychlé lokálně běžící AI na spotřebitelském hardwaru.

Co je MLX a co nový formát znamená?

MLX je open source framework od Apple pro strojové učení, který je speciálně přizpůsoben hardwarové architektuře Apple Silicon. Na rozdíl od jiných backendů pro umělou inteligenci, jako je PyTorch nebo TensorFlow, MLX přímo využívá výhod takzvané „unifikované paměti“ Apple - tj. sdíleného přístupu CPU a GPU ke stejné oblasti RAM. To zajišťuje výrazně efektivnější zpracování dat a modelů - zejména u velkých jazykových modelů, které mohou obsahovat i několik gigabajtů.

Přidružený formát MLX obvykle popisuje modely, jejichž váhy jsou uloženy v komprimovaném formátu souboru .npz (NumPy Zip). Modely jako Mistral, Phi-2 nebo LLaMA 3 lze do tohoto formátu převést pomocí příslušných nástrojů a spustit přímo na počítači Mac - bez cloudu, bez API, bez omezení.

V jiném článku uvádím Srovnání mezi Apple Silicon a NVIDIA a vysvětlit, jaký hardware je vhodný pro provozování místních jazykových modelů na Macu.

Současná situace: Co již Apple nabízí

S oznámením Apple Intelligence V roce 2024 začala společnost Apple integrovat funkce umělé inteligence přímo do operačního systému. Asistenti pro psaní, zpracování obrazu, sémantické vyhledávání, inteligentní poštovní funkce - většina z toho běží zcela lokálně, zejména v zařízeních s čipem M1 nebo novějším. Na starších počítačích Mac s procesorem Intel však žádná z nových funkcí není k dispozici.

Současně společnost Apple dále rozvinula rámec MLX a zveřejnila jej pod otevřenou licencí. V kombinaci s nástroji, jako je mlx-lm nebo nové rozhraní MLX Swift API, je již možné lokálně spouštět textové modely, nastavovat vlastní pracovní postupy nebo trénovat modely - přímo na vlastním počítači Mac, aniž by data opustila zařízení.

Zejména profesionální uživatelé - například z oblasti vývoje softwaru, vydavatelství, marketingu nebo výzkumu - z toho mohou mít velký prospěch, protože MLX jim poskytuje zcela nové možnosti integrace modelů AI do jejich pracovních postupů, aniž by se museli spoléhat na externí poskytovatele.

Jak funguje MLX v praxi

Pokud chcete MLX používat již dnes, potřebujete pouze terminál, Python (ideálně v samostatném virtuálním prostředí) a balíček mlx-lm, který obsahuje všechny potřebné funkce: Stažení modelu, kvantifikace, inference a chat. Po instalaci lze spustit hotové modely z komunity Hugging Face - např:

mlx_lm.chat --model mlx-community/Mistral-7B-Instruct-v0.3-4bit

K rozhraní API můžete přistupovat také pomocí skriptu Python. Modely se automaticky načítají, ukládají do mezipaměti a spouštějí se lokálně - bez připojení k internetu po prvním stažení.

Snadno lze také převést vlastní modely. Jediným příkazem můžete stáhnout modely z centra Hugging Face Hub, kvantifikovat je a zpřístupnit pro MLX:

python -m mlx_lm.convert --hf-path meta-llama/Llama-3-8B-Instruct -q

Výsledné soubory .npz pak lze trvale uložit na místě a znovu použít.

Srovnání: MLX vs. Ollama, Llama.cpp a LM Studio

Kromě MLX existuje několik zavedených alternativ pro lokální použití AI na Macu - především Ollama, Llama.cpp a LM Studio. Každý z těchto nástrojů má své silné stránky, ale také specifická omezení.

Ollama

Ollama je mezi vývojáři obzvláště oblíbený, protože nabízí jednoduchý příkazový řádek a rozhraní REST API. Modely jsou zde k dispozici ve formátu GGUF, což je optimalizovaný formát souborů pro rychlé spouštění na místních počítačích. Ollama se rychle nastavuje, je flexibilní a podporuje širokou škálu modelů. V současné době však Ollama neběží na počítači Mac s enginem MLX, ale používá především backend založený na metalu prostřednictvím souboru llama.cpp.

Pro pracovní postupy, které vyžadují automatizaci nebo bezhlavý provoz (např. procesy běžící na pozadí), je v současné době první volbou Ollama. Pokud však chcete používat vlastní optimalizace Apple, budete si muset počkat na budoucí integrace MLX.

Llama.cpp

Tento projekt tvoří základ pro mnoho dalších nástrojů (včetně Ollama) a nabízí velmi výkonný inferenční engine pro modely GGUF. Je mimořádně flexibilní, ale jeho použití a ovládání není vždy snadné - zejména pro začátečníky. Velká výhoda: existuje obrovská komunita, mnoho rozšíření a stabilní vývoj.

LM Studio

Kdo hledá grafické uživatelské rozhraní, obvykle skončí u LM Studia. Tento nástroj kombinuje stahování, správu a spouštění jazykových modelů ve štíhlé aplikaci pro Mac - včetně chatovacího rozhraní, konfigurace a správy modelů. Zajímavost: LM Studio již několik měsíců podporuje také engine MLX, který umožňuje plně využívat optimalizace Apple na počítačích Mac M1 nebo M2 - a to s výrazně nižší spotřebou paměti RAM než srovnatelné nástroje.

LM Studio je ideálním vstupním bodem do světa lokální umělé inteligence, zejména pro uživatele, kteří se nechtějí obtěžovat s terminálovými příkazy - a v kombinaci s MLX je to skutečně špičkový nástroj.

Snadné vyladění: Jak FileMaker 2025 přenáší školení LoRA do každodenního života

Zatímco MLX a Ollama ukazují, jak lze jazykové modely provozovat lokálně a integrovat je do stávajících procesů, další krok jde mnohem dál: cílené přizpůsobení těchto modelů vlastním datům. Právě v tom spočívá přístup s FileMaker 2025 z dceřiné společnosti Apple Claris na. Místo izolovaných tréninkových prostředí je vytvořeno strukturované rozhraní, ve kterém lze centrálně spravovat datové záznamy, parametry tréninku a verze modelu. Školení LoRA lze připravovat, spouštět a reprodukovat pomocí jasně definovaných procesů - bez nutnosti řídit každý krok ručně pomocí skriptů nebo příkazových řádků. Experimentální ladění se tak mění v reprodukovatelný pracovní postup, který lze integrovat do stávajících obchodních procesů. To je rozhodující výhoda zejména pro společnosti, které pracují s vlastními daty: UI nezůstává obecná, ale je vyškolena specificky pro jejich vlastní kontext.

Kdy je MLX na Silicon lepší volbou

Zatímco řešení založená na GGUF (Ollama, Llama.cpp) jsou velmi flexibilní a fungují na mnoha platformách, MLX boduje svou hlubokou integrací do světa Apple. Za zmínku stojí zejména:

Efektivní využití paměti díky sjednocené paměti
Optimalizace pro Metal/GPU bez složité konfigurace
Bezproblémová integrace do projektů Swift a rámců Apple
Odolnost vůči budoucnosti, protože Apple tento rámec dále aktivně rozvíjí.
Možnost rozšíření, např. prostřednictvím modelů na míru, jemného doladění a systémové integrace.

Pro uživatele Macu, kteří chtějí dlouhodobě plánovat a zachovat si plnou kontrolu nad svými daty, je MLX již nyní slibným vstupem do světa místní umělé inteligence - s potenciálem stát se v budoucnu standardem.

Od lokální umělé inteligence ke skutečným podnikovým procesům: Kde vstupují do hry systémy ERP

Co se v této souvislosti často podceňuje: Skutečná síla lokálních systémů umělé inteligence, jako je MLX nebo Ollama, nespočívá pouze v samotném modelu, ale také v jejich integraci do stávajících pracovních postupů. Zejména rozhraní a API umožňují nepoužívat AI izolovaně, ale integrovat ji přímo do provozních procesů - například při analýze dat, automatizaci textů nebo podpoře rozhodování.

Právě zde se stává ústředním článkem výkonný systém ERP: poskytuje data, strukturuje procesy a zajišťuje, aby výsledky AI byly nejen generovány, ale také smysluplně zpracovány. Každý, kdo chce vážně a produktivně využívat lokální AI, proto bude dlouhodobě potřebovat promyšlenou systémovou krajinu. Další informace na stránce Software ERP, kde bude představen systém ERP založený na FileMaker. FileMaker Server podporuje hostování jazykových modelů MLX od verze 2025. přímo na databázovém serveru a poskytuje odpovídající příkazy skriptu. Software od dceřiné společnosti Apple Claris běží na Apple Mac, Windows a mobilních zařízeních iOS.

Výhled: Kam chce Apple s MLX a Apple Intelligence směřovat?

S konferencí WWDC 2025 společnost Apple jasně naznačila, že MLX není trik, ale strategická součást rostoucího ekosystému Apple kolem umělé inteligence. Integrace nových „Foundation Models“ přímo do systémů macOS a iOS, nativní podpora Swiftu a další vývoj MLX směrem k trénování, kvantifikaci a inferenci jasně ukazují, že se Apple chce zapojit - ale po svém. V jiném článku ukazuji, kde Apple se Siri a Gemini v rámci partnerství se společností Google.

Apple zůstává věrný své linii: žádné velkolepé sliby, ale solidní, lokálně fungující technologie, která se dlouhodobě osvědčuje. Pro profesionální uživatele je to nejen atraktivní, ale také strategicky velmi zajímavé.

MLX je na dobré cestě stát se standardním řešením pro místní umělou inteligenci na Macu. Ti, kdo s ním pracují už dnes, získávají cenný náskok - ať už pro kreativní, technické nebo analytické aplikace. V kombinaci s nástroji, jako je mlx-lm, LM Studio nebo nové rozhraní Swift API, lze vytvořit robustní, spolehlivé a na budoucnost odolné prostředí AI - v souladu s řízeným, datově suverénním způsobem práce, který bude v budoucnu stále důležitější.

Aktuální průzkum umělé inteligence

Používání MLX na Macu - jednoduché pokyny pro začátečníky

S MLX vytvořila společnost Apple nový systém, který umožňuje používat umělou inteligenci (AI) přímo na vlastním Macu - bez připojení k internetu, bez cloudu, bez závislosti na Googlu nebo OpenAI. Skvělé na tom je, že pokud máte Mac s procesorem M1, M2, M3 nebo M4 (tj. Apple Silicon), můžete si MLX vyzkoušet v několika málo krocích. Vše běží lokálně - vaše texty, otázky a data nikdy neopustí váš počítač.

Zde vysvětlím krok za krokem, jak stáhnout a používat takzvaný jazykový model pomocí MLX. Zní to technicky - ale uvidíte, že je to snadné.

Krok 1: Zkontrolujte požadavky

Nejprve potřebujete:

Mac Apple Silicon (M1 nebo novější). Tuto informaci najdete v nastavení systému v části "O tomto Macu".
macOS 13 (Ventura) nebo novější.
Fungující připojení k internetu - pouze pro stažení modelu, poté vše běží offline.
Určitý úložný prostor, alespoň cca 8-10 GB u malého modelu.

Potřebujete také program „Terminal“, který je již před 1TP12 nainstalován na každém Macu. Použijeme jej k zadání několika příkazů. Najdete ho na Macu pod položkou „Aplikace/Utility“ nebo jednoduše napište a poté „Terminal“ a potvrďte klávesou „Enter“. Nebojte se - stačí pouze zkopírovat a vložit.

Krok 2: Zvířata Python 1TP12 (pouze v případě potřeby)

MLX pracuje s programovacím jazykem Python. Mnoho Maců již Python installiert má. Zda je k dispozici, si můžete ověřit zadáním následujícího příkazu do terminálu:

python3 --version

Pokud získáte číslo verze (např. Python 3.10.6), můžete pokračovat přímo.

Pokud ne, doporučuji použít Homebrew to installieren (oblíbený nástroj pro programy na Macu). To provedete tak, že do terminálu zadáte:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

Pak installier Python s:

brew install python

Krok 3: Nástroj MLX-Tool 1TP12Animal

Nyní si stáhneme nástroj MLX, s nímž můžete později používat jazykový model. K tomu slouží malý program installier s názvem mlx-lm. Zadejte jej do terminálu:

pip3 install mlx-lm

To zabere několik sekund. Po dokončení můžete načíst model.

Krok 4: Stažení a spuštění modelu

Nyní přichází ta vzrušující část: Na Macu získáte skutečný jazykový model - například verzi Mistral, velmi výkonný, volně dostupný model umělé inteligence. Jednoduše jej zadejte do terminálu:

mlx_lm.chat --model mlx-community/Mistral-7B-Instruct-v0.3-4bit

Tento příkaz provádí tři činnosti:

Model se stahuje automaticky (jednorázově).
Je připraven a spuštěn.
V terminálu se zobrazí okno chatu, ve kterém můžete klást otázky - podobně jako v ChatGPT.

Po dokončení stahování (může trvat několik minut v závislosti na rychlosti internetu) se zobrazí blikající kurzor. Nyní můžete psát např:

Povězte mi něco o historii Benátek.

...a model reaguje přímo - zcela offline.

Krok 5: Pokračujte v práci s modelem

Po ukončení můžete chat ukončit zadáním příkazu exit nebo zavřením okna. Později můžete stejný model znovu použít, aniž byste jej museli znovu stahovat, stačí znovu zadat stejný příkaz. Model je nyní uložen lokálně v počítači Mac a zůstane tam.
Pokud si chcete vyzkoušet různé modely, můžete tak učinit prostřednictvím Objímání obličeje nebo změnit název modelu přímo v terminálovém řádku - např:

mlx_lm.chat --model mlx-community/Phi-2-4bit

Každý model má jiný styl - některé jsou věcné, jiné více kreativní nebo zaměřené na dialog.

Ještě jednodušší? Použijte LM Studio jako rozhraní

Pokud dáváte přednost práci s myší a oknem, můžete vyzkoušet program LM Studio. Má příjemné rozhraní, podporuje MLX (na Apple Silicon) a umožňuje stahovat a používat modely jedním kliknutím.

Aplikaci LM Studio můžete získat zde:

👉 https://lmstudio.ai/

Po instalaci můžete v nastavení zvolit jako motor „MLX“ - program pak používá stejnou technologii jako výše, ale v pěkném okně s polem pro chat.

Dokázali jste to - nyní používáte moderní UI zcela lokálně na svém Macu, bez cloudu nebo předplatného. Apple MLX umožňuje efektivně, bezpečně a s ohledem na ochranu dat provozovat jazykové modely.

Pokud chcete později jít ještě hlouběji - například trénovat vlastní modely, vylepšovat je pomocí vlastních textů nebo je integrovat do vlastního softwaru (například FileMaker) - pak je pro vás MLX tou správnou volbou. První krok je však hotový: máte zpět kontrolu - a výkonnou umělou inteligenci přímo ve svém počítači.

Od lokálního modelu ke skutečné paměti AI

Článek o MLX jasně ukazuje, jak výkonnou se stala lokální umělá inteligence přímo na hardwaru Apple - zejména díky úzké integraci s architekturou Apple Silicon a optimalizovaným rámcům. Ollama se zaměřuje spíše na jednoduchou integraci, rozhraní API a flexibilní pracovní postupy, zatímco MLX je hluboce zakotven v ekosystému Apple a nabízí obrovský dlouhodobý potenciál. Právě k tomu slouží nová série článků: Jde o krok dále a ukazuje, jak lze tyto lokální modely AI rozšířit o skutečnou „paměť“. Namísto pouhého provádění modelů se vytváří znalostní báze, která export dat z historie vlastního chatu z ChatGPT. a umožňuje sémantické vyhledávání. Místní umělá inteligence tak není jen nástrojem, ale osobním systémem, který roste spolu s vašimi znalostmi.

Sociální otázky současnosti

Často kladené otázky

Co přesně je MLX a jak se liší od PyTorchu nebo TensorFlow?
MLX je framework pro strojové učení vyvinutý společností Apple, který byl speciálně optimalizován pro Apple Silicon (M1-M4). Na rozdíl od PyTorch nebo TensorFlow, které jsou zaměřeny na mnoho platforem, využívá MLX speciálně architekturu čipů Apple - např. společnou strukturu paměti (unified memory) a kovovou akceleraci GPU. V důsledku toho pracuje na počítačích Mac s větší paměťovou úsporností a rychleji - ovšem pouze na hardwaru Apple.
Proč byste si měli vybrat MLX a ne nástroj jako Ollama nebo Llama.cpp?
MLX má výhodu, pokud pracujete konkrétně na Apple Silicon a chcete ze zařízení získat maximální výkon. Modely Ollama a Llama.cpp jsou velmi flexibilní, ale na počítači Mac často pracují méně efektivně. MLX lze také integrovat přímo do projektů Swift - ideální pro vývojáře, kteří vytvářejí aplikace blízké Apple. Nejedná se o konkurenta Ollama - ale o specializovaný nástroj pro profesionály.
Které modely jsou kompatibilní s MLX?
Mnoho otevřených jazykových modelů je kompatibilních - například Mistral, LLaMA 2 a 3, Phi-2 nebo TinyLLaMA - které jsou buď již převedeny, nebo je lze převést pomocí nástroje mlx-lm.convert. Důležité je, aby byly k dispozici ve formátu NumPy-ZIP (.npz) a byly připraveny pro MLX. Pro modely kompatibilní s MLX je nyní k dispozici samostatná sekce Objetí tváře.
Jak snadné je začít? Musím být vývojář?
Trocha technických znalostí je užitečná - např. pro terminál, prostředí Pythonu nebo názvy modelů. Ale začátek je díky mlx-lm poměrně snadný: jeden instalační příkaz, jeden příkaz ke spuštění, hotovo. Pokud dáváte přednost práci s uživatelským rozhraním, můžete použít LM Studio - to nyní podporuje MLX i na Macu.
Mohu MLX trénovat i pro své vlastní projekty - např. s vlastními texty?
Ano, můžete - ale školení je v současné době určeno spíše pro pokročilé uživatele. Většina uživatelů používá modely MLX pro inferenci (tj. pro odpovědi, generování textu atd.). Pro trénování nebo dolaďování je třeba znát LoRA, datové formáty (JSONL) a paměťové nároky - nebo používat nástroje, jako je FileMaker 2025, které tento proces zjednodušují.
Jak je to s bezpečností a ochranou dat ve společnosti MLX?
Velmi dobře - protože MLX běží zcela lokálně. Všechna data, vstupy a odpovědi modelu zůstávají na vašem počítači. Neexistuje žádný cloudový přenos, žádné externí rozhraní API - ideální pro projekty citlivé na data, interní dokumenty, chráněná data zákazníků nebo důvěrné poznámky.
Jakou roli v tom hraje samotný Apple? Bude MLX dále rozvíjen?
Společnost Apple zveřejnila MLX pod otevřenou licencí a aktivně jej dále rozvíjí - zejména ve spojení se systémem Apple Intelligence, systémem umělé inteligence pro macOS, iOS a iPadOS. Na konferenci WWDC 2025 byl MLX představen jako oficiální rámec pro integraci vlastních jazykových modelů do softwaru Apple. Lze předpokládat, že MLX bude ve světě Apple nadále nabývat na významu.
Mohu MLX kombinovat i s jinými nástroji, např. Neo4j, n8n nebo FileMaker?
Ano - MLX je čistý ML framework, ale lze jej připojit k dalším nástrojům prostřednictvím REST API, vlastních služeb Pythonu nebo lokálních obalů. Můžete jej například integrovat do vlastní automatizace (n8n), sémantické databáze (Neo4j) nebo řešení FileMaker - poslední jmenované je nyní dokonce nativně dostupné s FileMaker 2025.

Obrázek (c) Monoar_CGI_Artist @ pixabay

Aktuální články o umění a kultuře

Cookie	Délka	Popis
cookielawinfo-checkbox-analytics	11 měsíců	Tento soubor cookie je nastaven pomocí pluginu GDPR Cookie Consent. Tento soubor cookie slouží k uložení souhlasu uživatele se soubory cookie v kategorii "Analytika".
cookielawinfo-checkbox-functional	11 měsíců	Soubor cookie je nastaven na základě souhlasu s GDPR, aby zaznamenal souhlas uživatele se soubory cookie v kategorii "Funkční".
cookielawinfo-checkbox-necessary	11 měsíců	Tento soubor cookie je nastaven pomocí pluginu GDPR Cookie Consent. Tento soubor cookie slouží k uložení souhlasu uživatele se soubory cookie v kategorii "Nezbytné".
cookielawinfo-checkbox-others	11 měsíců	Tento soubor cookie je nastaven pomocí pluginu GDPR Cookie Consent. Tento soubor cookie slouží k uložení souhlasu uživatele se soubory cookie v kategorii "Ostatní.
cookielawinfo-checkbox-performance	11 měsíců	Tento soubor cookie je nastaven pomocí pluginu GDPR Cookie Consent. Tento soubor cookie slouží k uložení souhlasu uživatele se soubory cookie v kategorii "Výkon".
viewed_cookie_policy	11 měsíců	Tento soubor cookie je nastaven pomocí zásuvného modulu GDPR Cookie Consent a slouží k uložení informace, zda uživatel souhlasil s používáním souborů cookie. Neukládá žádné osobní údaje.

MLX na Apple Silicon jako místní AI ve srovnání s Ollama & Co.