KI-Modelle, KI-Modell-Größe, Lokale Modell-Laufzeit, Modelle auf Consumer-Hardware, Minimax, VRAM, Server-Kosten, ...