Apple Intelligence darf viele große Websites nicht fürs eigene Training nutzen. Die Betreiber verhindern durch entsprechende Voreinstellungen, dass ihre Datenbestände von Apples KI abgegrast werden, allerdings dürften dabei wirtschaftliche Überlegungen den Ausschlag geben.
Generative Sprachmodelle werden gut, indem sie mit immensen Datenbeständen trainiert werden. Je mehr Daten sie verarbeiten, desto besser funktioniert die sich von Wort zu Wort hangelnde Textvorhersage – mehr sind Modelle wie ChatGPT im Kern nicht – und liefet die so erstaunlich menschlich wirkenden Sätze und Formulierungen. Apple Intelligence nun ist bei vielen großen Websites und Onlinediensten laut Medienberichten nicht willkommen, diese haben angegeben, dass Apple deren Daten nicht durchsuchen und für das KI-Training heranziehen kann. Diese Möglichkeit hatte Apple im Rahmen der WWDC 2024 erläutert. In der robot’.txt, einer simplen Textdatei, die im Hauptverzeichnis einer Domain abgelegt ist, lässt sich vom Betreiber festhalten, was Suchmaschinen und deren automatisierte Routinen an Daten für ihren Index abgreifen und nutzen dürfen. Dort kann auch vermerkt werden, dass Apple draußen bleiben muss.
Meta hat etwa für Facebook und Instagram diese Einstellung gesetzt, auch die FT, die New York Times und USA Today haben etwas gegen Apple Intelligence, daneben auch Craigslist und Tumblr.
Betreiber dürften Geld sehen wollen
Apple hatte zwar für Apple Intelligence schon Daten im Web eingesammelt, die KI ist jedoch deutlich jünger als die von OpenAI und anderer Anbieter und daher im Rückstand.
Bei dieser Haltung muss es indes nicht bleiben. Apple dürfte durchaus noch eine Chance haben, die eigenen Modelle mit den Daten dieser großen und wichtigen Plattformen zu trainieren, doch diese haben wohl die Absicht, sich dafür bezahlen lassen zu wollen.
So dürfte etwa Meta eine weitere Möglichkeit sehen, seine Nutzerdaten zu Geld zu machen und Apple eine gesalzene Rechnung dafür präsentieren, dass der iPhone-Konzern seine KI mit Texten und Bildern aus Facebook und Instagram weiter Hochrüsten darf. Auch große Zeitschriftenverlage haben ein begründetes Interesse daran, ihre Inhalte den KI-Giganten nicht kostenlos zur Verfügung zu stellen.
5 Gedanken zu „Auch Facebook und Instagram: Große Plattformen wollen Apple Intelligence nicht an Daten lassen“
Die Kommentare sind geschlossen.