KI-Kosten sind kein Lizenzthema mehr
Kurzfassung: Die hohen Investitionen von Microsoft, Alphabet und NVIDIA zeigen: KI-Leistung wird zu einer knappen Betriebsressource. Für KMU zählen deshalb nicht nur Monatslizenzen, sondern Grenzkosten je Vorgang, Antwortzeiten und Verfügbarkeit.
Viele Mittelständler bewerten KI-Ausgaben noch wie klassische Software: Was kostet die Lizenz pro Nutzer, welche Funktionen sind enthalten, wie lang läuft der Vertrag? Dieser Blick reicht nicht mehr aus, sobald KI regelmäßig Arbeit vorbereitet, Kundenantworten beschleunigt oder interne Auswertungen erzeugt. Dann entsteht neben der Lizenz eine zweite Kostenlogik: Jeder zusätzliche Vorgang verbraucht Rechenleistung, erzeugt Wartezeit, braucht verlässliche Bereitstellung und kann bei hoher Nutzung teurer werden als erwartet.
Die Meldungen der großen Anbieter machen diese Verschiebung greifbar. Microsoft verweist in den FY25-Q2-Unterlagen auf starkes Wachstum im Cloud- und KI-Geschäft sowie hohe Investitionen in Cloud- und KI-Infrastruktur. Alphabet beschreibt im Form 10-K für 2024 erhebliche Ausgaben für technische Infrastruktur, insbesondere Server und Rechenzentren, und erwartet weiterhin hohe Investitionen zur Unterstützung von KI- und Cloud-Nachfrage. NVIDIA meldete für Q2 FY2025 einen Umsatz von 30,0 Milliarden US-Dollar; der Data-Center-Umsatz lag bei 26,3 Milliarden US-Dollar und stieg laut Unternehmen um 154 Prozent gegenüber dem Vorjahr.
Diese Zahlen sagen nicht, dass jede Cloud-Leistung für jedes KMU sofort teurer wird. Sie sagen aber, dass KI-Rechenleistung kein unbegrenztes Hintergrundrauschen ist. Sie wird gebaut, finanziert, ausgelastet und priorisiert. Genau deshalb sollten Unternehmen bei KI nicht nur fragen, welches Paket sie einkaufen, sondern welche Abhängigkeit je Arbeitsvorgang entsteht.
Grenzkosten sind die unterschätzte Frage
Bei klassischer Bürosoftware ist der zusätzliche Klick meist betriebswirtschaftlich unsichtbar. Ob ein Mitarbeiter eine weitere E-Mail schreibt oder eine weitere Folie öffnet, verändert die Kosten selten direkt. Bei intensiver KI-Nutzung kann das anders aussehen. Eine einfache Textüberarbeitung ist etwas anderes als eine mehrstufige Analyse großer Dokumente, eine Variantenberechnung für Angebote oder eine Servicehilfe, die mehrere Informationsbestände auswertet.
Für die Geschäftsleitung wird deshalb die Kostenfrage kleinteiliger. Was kostet eine Angebotsvorbereitung mit KI-Unterstützung tatsächlich, wenn sie jeden Tag hundertfach genutzt wird? Wie viele Abfragen entstehen pro Kundenfall? Werden Ergebnisse beim ersten Mal brauchbar, oder führen Korrekturen zu weiteren Modellaufrufen? Muss zusätzlich ein Fachexperte prüfen, weil die Antwort zwar schnell, aber nicht sicher genug ist?
Der Grenzkostenblick verändert die Auswahl von Einsatzfeldern. Ein spektakulärer Anwendungsfall kann kaufmännisch schwächer sein als ein unscheinbarer Vorgang, der häufig wiederkehrt und bei dem jeder KI-Einsatz klar Zeit spart. Umgekehrt kann eine Anwendung, die im Test günstig wirkt, im Alltag teuer werden, wenn sie viele Iterationen, große Dokumente oder aufwendige Prüfungen erzeugt.
Antwortzeit wird Teil des Kundenversprechens
Kosten sind nur eine Seite. Die andere ist Latenz. Solange KI im Hintergrund hilft, ist eine kurze Verzögerung oft unkritisch. Wenn sie aber Teil der Leistungserbringung wird, bekommt Antwortzeit eine andere Bedeutung. Ein Vertriebsteam, das Angebote schneller zusagen will, kann sich nicht dauerhaft auf eine Lösung verlassen, die unter Last spürbar schwankt. Ein Servicebereich, der Erstreaktionen beschleunigen möchte, braucht nicht nur gute Formulierungen, sondern eine gleichmäßige Taktung.
Das ist besonders wichtig, weil Kunden nicht zwischen Modell, Cloudanbieter und interner Organisation unterscheiden. Sie erleben nur, ob eine Antwort verlässlich kommt. Wenn ein Unternehmen KI in den Kundenkontakt einbaut, wird externe Rechenleistung indirekt Teil des eigenen Serviceversprechens. Dann reicht es nicht, im Einkauf den günstigsten Zugang zu wählen. Entscheidend ist, ob die Leistung zum erwarteten Rhythmus des Geschäfts passt.
Für KMU bedeutet das keine Pflicht zu eigener Infrastruktur. Lokaler Betrieb kann bei sensiblen Informationen, sehr hoher planbarer Nutzung oder besonderen Anforderungen sinnvoll sein. Er bringt aber eigene Lasten mit sich: Hardware, Energie, Aktualisierung, Sicherheit, Kompetenz und Ausfallszenarien. Die nüchterne Frage lautet nicht „Cloud oder lokal“, sondern: Welche Aufgaben brauchen garantierte Verfügbarkeit, welche vertragen Schwankung, und wo genügt ein Standardzugang?
Verfügbarkeit gehört in die Kalkulation
Die Anbieterzahlen zeigen, dass der Markt massiv investiert, aber auch, dass Kapazität ein strategischer Engpass bleibt. Für ein mittelständisches Unternehmen ist daraus keine Panik abzuleiten. Wohl aber eine neue Kalkulationsdisziplin: KI-Nutzen sollte nicht nur unter Idealbedingungen gerechnet werden.
Ein belastbarer Business Case prüft drei Varianten. Erstens: Was bringt die Anwendung bei heutigen Preisen und Antwortzeiten? Zweitens: Bleibt sie sinnvoll, wenn Nutzung stärker wächst als geplant? Drittens: Was passiert, wenn Antwortzeiten schwanken oder Kontingente enger werden? Diese Fragen sind weniger technisch als kaufmännisch. Sie verhindern, dass ein Team Arbeitsweisen auf eine Ressource aufbaut, deren Randbedingungen nie offen besprochen wurden.
Gerade für Führungskräfte im Mittelstand ist das die neue Erkenntnis: KI-Kosten sitzen nicht nur in der Rechnung des Anbieters. Sie entstehen im einzelnen Vorgang, in der Wartezeit, in der Nachprüfung und in der Erwartung, dass externe Leistung jederzeit verfügbar bleibt. Wer KI so betrachtet, entscheidet vorsichtiger, aber besser. Er skaliert nicht die eindrucksvollste Anwendung, sondern diejenige, deren Grenzkosten, Antwortzeit und Verfügbarkeit zur eigenen Leistung passen.
← Zurück zum Blog