LLMs
Günstiger pro Token, teurer insgesamt. Das ist die Paradoxie, mit der KI-Verantwortliche im Finanzsektor gerade konfrontiert sind. Die Kosten pro Verarbeitungseinheit sinken kontinuierlich, aber die Gesamtrechnung steigt. Das klingt widersprüchlich, ist aber erklärbar — und wer den Mechanismus dahinter versteht, trifft bessere Architekturentscheidungen. Was Inference überhaupt bedeutet Bevor es um Kosten
by Emil Ohligs, Apr 18, 2026
Wer ein KI-Modell auswählt, verlässt sich auf eine einfache Annahme: Das Modell mit der höchsten Accuracy auf dem Testset ist das beste Modell für den Produktionseinsatz. Eine Studie vom MIT zeigt, dass diese Annahme systematisch falsch sein kann — und zwar nicht aufgrund von Overfitting oder schlechter Architektur, sondern wegen eines
by Emil Ohligs, Apr 11, 2026
Künstliche Intelligenz wird häufig als einheitliche Technologie wahrgenommen. In der Praxis basiert moderne KI jedoch auf grundlegend unterschiedlichen Architekturen, die jeweils für klar abgegrenzte Problemklassen optimiert sind. Ob ein System Texte analysiert, Bilder erkennt oder autonome Entscheidungen trifft, hängt nicht von einer allgemeinen „Intelligenz“ ab, sondern von der strukturellen Auslegung
by Emil Ohligs, Feb 07, 2026
Disclaimer: In diesem Artikel versuche ich das Thema Large Language Models (LLMs) und ihre Funktionsweise kurz und möglichst intuitiv zu erklären. Hierbei dient das phänomenale Video vom Youtube Kanal "3Blue1Brown" als Hauptquelle. Generell kann ich diesen Kanal für mathematische Konzepte sehr empfehlen. Zu jeder Formel und jedem Theorem
by Emil Ohligs, Nov 06, 2025