Diffusion oder Steal it till you own it

Bildhinweis: Das Bild hat der Autor aus KI-Bildern (StableDiffusion und DALL-E) hergestellt.

Während unseres Sonntagsfrühstücks gestern lief die Sendung Essay und Diskurs des Deutschlandfunks: „Notizen aus der verkrempelten Welt“, in der Gabriel Yoran sich Gedanken machte: Was war noch gleich Fortschritt?
Er meinte, viele Dinge, die uns als Schritt zu einem einfacheren Leben verkauft werden, erweisen sich im Alltag eher als Verschlimmbesserung, sind unfreundlicher zu bedienen, weil unübersichtlicher und komplizierter: Geräte, Apps, Plattformen. Er nennt das „Die Verkrempelung der Welt“, die immer öfter nervt. Der Autor sieht darin kein Naturgesetz, sondern eine Mischung aus Bequemlichkeit, die von PR benutzt wird, um Gewinn zu machen. Die gerade laufende IFA in Berlin scheint mir eine einzige Illustration dafür zu sein. Niemand muss mehr einen Schalter im Smart Home bedienen, der Kühlschrank macht die Bestellungen, damit die KI-Küchenmaschine Cookit mit einem AI Recipe Converter aus Online-Rezepten mit Hilfe einer Schritt-für-Schritt-Anleitung automatisch das Essen zubereitet. Die KI macht das Leben heute so bequem, wie es der Heinzelmann von Loriot¹ vor Jahrzehnten noch nicht konnte.

Also KI ist überall. Mit Machine-Learning-Algorithmen dürfen „die Kreativleistungen von Autoren und Künstlerinnen ausgeplündert werden, weil sonst die Bedürfnisse der Kundschaft nicht befriedigt werden können, so OpenAI-CEO Sam Altman.“, hörte ich den DLf-Sprecher vorlesen, und dann den Satz: „Die gängige Silicon-Valley-Formel ‚Fake it till you make it‘ – was ist die schon gegen ‚Steal it till you own it‘.“²

„Fake it till you make it“ ist das Mantra von Schein-Performanz in der Start-Up-Welt. „Steal it till you own it“ benennt die Arbeitsweise dahinter: Nimm dir von der Welt, was und soviel du willst. Das demonstrierten Trump und seine Gäste, die Big-5-CEOs: Apple’s Tim Cook, Microsoft’s Satya Nadella, Google’s Sundar Pichai, Oracle’s Safra Catz, OpenAI’s Sam Altman und andere³. Es war eine Bühne für die Aufführung der Weltaneignung. Hier versprachen nicht nur Investoren ihrem Herrscher Investitionen, sondern inszenierten diesen Akt als nationale Partnerschaft – ein lebendiger Beleg, dass ‚Steal it till you own it’ längst politisch etabliert ist.

Wenn wir über KI sprechen, geht es nicht mehr nur um großspurige Startup-Rhetorik, sondern um die Frage der Aneignung: Wie wird aus der Urheberschaft und dem Eigentum Millionen Einzelner das Produkt eines Konzerns? Das will ich verstehen, auch, wie durch das Lernen von Sprachmodellen und Bildgeneratoren Weltwissen und Weltkunst von den Urhebern zu neuen Eigentümern strömt.
Es ist eine Diffusion, ein Zerteilen des ursprünglichen Werkes in kleinste Einheiten, ein Zerhacken in
Wörter oder Wortteile, in sogenannte Tokens, bei Texten oder in Weißes Rauschen bei Bildern. Ein Künstliches Neuronales Netz schiebt dann alles wieder zu einem marktfähigen KI-Produkt zusammen. Dessen Verkäufer kleben Preisschilder drauf, entwickeln Tarif- oder Lizenzmodelle und sagen: „Das gehört jetzt uns.“

„Fake it till you make it“ war lange der Spruch von Start-Up-Gründer:innen. Den Eindruck vermitteln, als vermöge man alles, wenn nur das Firmenwachstum durch genügend Kapital gesichert ist. Für einige der besten Vermarkter heißt es nun: „Steal it till you own it“. OpenAI und Microsoft trainieren ihre KI, ohne dass Urheber:innen einzeln gefragt oder vergütet werden. Googles DeepMind verfährt ähnlich bei den Text- und Bildmodellen Gemini und Imagen. Stability Ai’s Stable Diffusion wurde mit Daten aus dem offenen Netz trainiert, was viele Künstler:innen als Diebstahl empfinden. Midjourney, der Bildgenerator, der Stile ohne Lizenzierung der Urheber reproduziert, macht es so. Verantwortlich dafür ist u.a. Sam Altman von OpenAI, ein Meister der Verkündung großer Visionen, aber immer mit von der Partie bei der Aneignung und Kommerzialisierung fremden Urheberguts. Sein ehemaliger Buddy Elon Musk ebenso. Er lebt den Spruch „move fast, break things“ – und man kann ergänzen: gern auch auf Kosten anderer. Den Leitspruch hat Mark Zuckerberg von Meta erfunden. Für Stability AI’s Emad Mostaque war die freie Verfügbarkeit von Daten nie eine diskussionswürdige Frage.⁴
Ich verstehe den Leitspruch in der KI-Welt so: Nehmen, was da ist, sich aneignen, was sich kommerzialisieren lässt und durch Diffusion die Simulation von Originalität ermöglichen.

In der Physik bedeutet Diffusion, dass sich Teilchen ausbreiten und dadurch physikalische Differenzen ausgleichen.
In der KI der Bildgenerierung bezeichnet das Wort die heute vorherrschende Methode. Der digitalisierte Bildfundus, ein möglichst umfangreicher Teil der visuellen Weltkultur, wird bis zum statistischen Rauschen zerhackt und zur Dressur Neuronaler Netze verwendet. Sie lernen dabei, den Weg vom Rauschen zu einem neuen Bild zurückzugehen, das so aussehen soll, wie jemand es vorher mit Worten beschrieben hat: Das Bild einer Katze vor einem Spiegel, das eines leeren, einsamen Strandes, des Gesichts eines alten Mannes. Das System hat nichts über Katzen, Strände und Gesichter gelernt, sondern folgt nur dem angelegten Pfad der Entrauschung von Pixeln und aus Milliarden von Bildteilchen nach den Anweisungen einer Wortfolge, des Prompts, den ein Mensch formulierte.
In beiden Fällen verwischt die Diffusion Unterschiede: in der Physik die Konzentrationen von Teilchen in getrennten Räumen, in der Bilderzeugung durch KI die Spuren ihrer Urheber.

Auch Sprachmodelle zerhacken die zur Verfügung stehende Textwelt. Dort heißt der Gewaltakt „Tokenisierung“. Aus Wörtern und Sätzen werden Nummernfolgen, kleinste Einheiten, eher
einzelne Silben als Begriffe. Romane, Forenbeiträge, Zeitungsartikel, Gesetzestexte, Gedichte werden
in Einzelteile zerlegt, die in einem Kontext nur noch statistische Folgewahrscheinlichkeiten sind: Nach „Käthe“ folgt oft „Kollwitz“; nach „ich liebe“ häufig „dich“, vor dem Wort „Strand“ findet man in der Weltliteratur „windig“, „leer“, „einsam“. Aus einer ungeheuren Masse an Wortübergängen lernt die KI einen Mechanismus, der fortsetzt, ergänzt, paraphrasiert. Das Modell „weiß“ nichts, hat über Wirklichkeit
nichts gelesen, sondern nur die Wahrscheinlichkeiten für Wortfolgen zu erzeugen gelernt.
So wie es Bilder nicht sehen kann, hat es kein Weltverstehen. In beiden Fällen wird ein ungeheures
Ganzes in Fragmente zerlegt, um daraus ein neues Ganzes zu generieren. Das Ergebnis wirkt oft überzeugend, manchmal geradezu atemberaubend. Aber es ist ein Statistik-Aufguss der Kultur, kein neues organisches Gewächs.

Doch ist jedes durch KI generierte Produkt immer etwas Neues. Nicht ein Pixel in einem Bild eines Diffusionsmodells kann einem Künstler oder einer Künstlerin zugeordnet werden, für keinen mit einem Sprachmodell erzeugten Satz lässt sich ein Autor oder eine Autorin finden. Plagiatsjäger werden nichts aufdecken, was zu beanstanden ist, es sei denn, Nutzer einer KI haben bewusst ein Zitat verlangt. Dennoch kann die Szene eines generierten Bildes an den Maler X erinnern, an dessen Pinselführung oder Farbpalette, daran wie Ränder verlaufen, wie Glanzlichter gesetzt wurden. Das KI-Modell hat all diese Spuren zu imitieren gelernt.
Ähnlich ist es bei der Texterzeugung. Die Maschine schreibt in einem bekannten Tonfall, greift typische
Motive auf und führt Argumente weiter.
Die Struktur des KI-Modells, entworfen von intelligenten Menschen, die reichen und vielfältigen Trainingsdaten, beschafft auf welche Art auch immer, die Formulierungen eines Prompts oder
der Promptfolgen eines möglicherweise kreativen Menschen bei der Nutzung des Systems haben das Ergebnis geschaffen. Wer ist nun Urheber, wer Eigentümerin?

Klassisches Urheberrecht schützt konkrete Werke, nicht abstrakte Merkmale. Die aber werden von der KI gelernt. Ohne die Summe aller Werke, die zum Training benutzt wurden, würde kein neues Produkt entstehen. Das ist die eigentliche Pointe hinter „Steal it till you own it“: Aus der Aggregation des Gemeinsamen werden Systeme für neue Eigentümer geschaffen. Die Kultur lieferte die Rohstoffe, diese nur noch Personal, Software, Hardware, die Schnittstelle zum Nutzer plus der AGB. Der Konflikt ist dabei weniger juristisch, vielmehr kulturell. Weil ein Stil juristisch als „nicht schützbar“ gilt, finden jene, die ihn über Jahre entwickelt haben sich nur in einer industriellen Nachbildung wieder. „Walter Benjamins Aura wandert vom Atelier ins API-Gateway, in eine KI-Integration auf der Website, die man im Abo kauft, und die Originalität des Geschriebenen aus der Hand der Autorin, durchwandert das Sprachmodell und kehrt als KI-Text zurück – sofort abrufbar, auf Knopfdruck.“⁵
Aus der Sicht der KI-Konzerne ist das kein Diebstahl, sondern nur eine Transformation, aus der vieler Urheberinnen und Urheber ist es eine Umverteilung ohne fairen Ausgleich. Der Gewinn für Nutzer:innen ist eine enorme Beschleunigung des Arbeitens. Schon mit wenigen geschriebenen oder gesprochenen Worten im Prompt eröffnet sich ihnen der Zugang zu Wissen, Formulierungen und Bildern, die zu bekommen sonst Stunden, Tage oder Jahre gekostet hätten. Und aus Sicht der Gesellschaft ist es einerseits ein gewaltiger Effizienzgewinn, birgt andererseits aber auch das Risiko, dass menschliche Originalität versiegt.

Mit Gabriel Yoran frage ich nach der Krempelhaftigkeit der KI. Ist sie Fortschritt oder kann sie weg? Praktisch ist das mit dem Wegkönnen bereits beantwortet. Sie ist in der Welt und wird bleiben.
Ob sie Fortschritt ist, hängt von ihrem Gebrauch ab. Als Werkzeug beflügelt sie, beschleunigt, vereinfacht Arbeit und öffnet neue Räume für Kreativität. Mir hat ChatGPT heute geholfen, über KI nachzudenken und diesen Text zu schreiben. Als Schlusssatz schlug es vor:
„Als Konsumprodukt im Abo droht KI, Kultur in vorgekaute Fragmente zu zerlegen und Originalität durch Simulation zu ersetzen. Fortschritt ist sie nur dann, wenn sie dem Gemeinsamen dient, statt es einseitig in Eigentum zu verwandeln. Alles andere bleibt glänzender Krempel, der bald wieder im Technikmuseum landen sollte.“

Die Alten erinnern sich: Der berühmte Werbeslogan „Es saugt und bläst der Heinzelmann, wo Mutti sonst nur saugen kann“ stammt aus Loriots Sketch „Vertreterbesuch bei Hoppenstedts“. Auch damals war schon Fortschritt. ↩︎
DLF, Notizen aus der verkrempelten Welt, Gabriel Yoran, 07.09.2025 ↩︎
Viel Lob für Trump bei Tech-Dinner – Zuckerberg durch eingeschaltetes Mikro bloßgestellt ↩︎
Ich habe Perplexity gefragt, ob meine Beschreibung korrekt ist, und ich habe die Antwort bekommen:
Der Text gibt das Gefüge aktueller Diskussionen rund um KI, Urheberrecht und Unternehmensphilosophien weitgehend korrekt wieder – allerdings gibt es bei einzelnen Formulierungen und Kontexten kleinere fachliche Feinheiten, die präzisiert werden sollten, um Missverständnisse und Generalisierungen zu vermeiden…
Grundsätzlich ist der Text im Duktus gesellschaftskritischer Essays in Ordnung, aber einzelne Aussagen (v.a. zu Rechtslage, Sprachgebrauch und individueller Haltung) könnten präziser oder differenzierter dargestellt werden, um Schwarz-Weiß-Bilder zu vermeiden. ↩︎
Das hat ChatGPT für mich so formuliert. ↩︎