Zum Inhalt springen
News

Suchen Sie in der Datenbank der Pirateriebücher, auf die KI trainiert wurde, während Trump Ihre lokale Bibliothek zerstört

Trump, DOGE und große Tech-Konzerne wie OpenAI und Meta interessieren sich nicht für freien Zugang zu Büchern, es sei denn, es nützt ihrer KI.
Von Kyle Barr Übersetzt von

Lesezeit 4 Minuten

Unser Zugang zu kostenloser Literatur wird von zwei Seiten missbraucht: Auf der einen Seite steht eine von Tech-Oligarchen übernommene US-Regierung, auf der anderen Seite einige der Oligarchen und anderen großen Tech-Firmen. KI, entwickelt von Unternehmen wie Meta, hat Millionen von Büchern von Piratenseiten verschlungen. Wenn Sie jedoch keine von KI generierten Inhalte lesen möchten, plant die Bundesregierung unter Präsident Donald Trump, eine der Hauptfinanzierungsquellen für öffentliche Bibliotheken zu streichen. Es ist eine schlechte Zeit, wenn Sie gerne lesen.

LibGen: Der virtuelle Bücherdieb?

In den letzten zwei Jahren hat The Atlantic öffentlich zugängliche Datensammlungen analysiert und erstellt, die zur Schulung von KI verwendet werden. Die Seite richtete ihren Blick auf LibGen, ein Archiv von raubkopierten Medien, das Millionen von Büchern, wissenschaftlichen Arbeiten und anderen Artikeln umfasst. Kürzlich veröffentlichte die Seite ihre Ergebnisse zusammen mit einem Werkzeug, mit dem man im Archiv von Millionen von raubkopierten Werken suchen kann. Damit können Sie nach Ihren Lieblingsautoren suchen, um herauszufinden, ob sie verwendet wurden, um KI-Modelle von Unternehmen wie OpenAI, Mistral und Meta zu trainieren.

LibGen, eine Abkürzung für Library Genesis, wird online als „Schattendatenbank“ bezeichnet, da es sich um raubkopierte, aber offene Inhalte handelt. Laut dem Bericht von The Atlantic enthält es fast 7,5 Millionen Bücher und 81 Millionen wissenschaftliche Arbeiten. Während es eine Menge urheberrechtlich geschütztes Material enthält, verbergen sich dahinter tatsächliche Vorteile für die Gesellschaft. Library Genesis wurde auch von Wissenschaftlern genutzt, um ohne überhöhte Gebühren der Verlage auf wissenschaftliche Arbeiten zuzugreifen. Andere Schattendatenbanken wie Sci-Hub wurden von Gruppen wie der Electronic Frontier Foundation als objektiv gut für den Fortschritt der Wissenschaft anerkannt.

Kampf um das Urheberrecht

Gizmodo hat Meta um einen Kommentar gebeten, aber wir haben nicht sofort eine Antwort erhalten. Wir haben auch Mistral und OpenAI nach ihrer Nutzung von LibGen gefragt. Ein Sprecher von OpenAI sagte in einer Erklärung gegenüber Gizmodo: „Die Modelle, die ChatGPT und unsere API heute antreiben, wurden nicht mit diesen Datensätzen entwickelt. Diese Datensätze, die von ehemaligen Mitarbeitern erstellt wurden, die nicht mehr bei OpenAI sind, wurden zuletzt 2021 verwendet.“

Auch wenn LibGen jetzt nicht im Zentrum von OpenAIs Arbeit steht, ist klar, wo es und andere KI-Unternehmen stehen, und es sieht aus wie ein Piratenschiff. Letztes Jahr sagte ein ehemaliger OpenAI-Mitarbeiter, er glaube, das Unternehmen breche das Urheberrecht, obwohl sich OpenAI vor Gericht gegen Urheberrechtsklagen verteidigt hat, die behaupten, die Verwendung urheberrechtlich geschützter Werke für die KI-Ausbildung sei fair use. Websites wie The Verge haben bereits die Pläne von Meta abgedeckt, LibGen zu nutzen, um OpenAI und Mistral zu überholen. Die neuesten Gerichtsakten aus einer Sammelklage, die von der Komikerin Sarah Silverman angeführt wird, erwähnen die Meta-Hauptforscherin Melanie Kambadur, die sagte, Meta würde „sofort“ Bücher benötigen, da „Bücher tatsächlich wichtiger sind als Webdaten“ für die Ausbildung von KI. Weitere Dokumente zeigen, dass das Unternehmenspersonal überlegt hatte, Bücher zu lizenzieren, um seine KI zu trainieren, sich jedoch für ein raubkopiertes Archiv entschied. Ein Technischer Direktor sagte, wenn sie „ein einziges Buch“ lizenzieren, könne das Unternehmen dann nicht das Argument für „fair use“ verwenden.

Die rechtlichen Auseinandersetzungen um KI und Urheberrechte

Wenn Sie sich fragen, wie weit oben das dreiste „Ausleihen“ reichen könnte, bezieht sich ein weiteres E-Mail-Dokument auf eine „Eskalation zu MZ“, was sich auf CEO Mark Zuckerberg als den endgültigen Entscheidungsfinder beziehen könnte. The Atlantic behauptet weiter, dass Meta einen Torrent verwendet hat, um LibGen herunterzuladen, was die Dateien direkt an andere Personen verteilt hat, und damit gegen das Urheberrecht verstoßen würde. Meta hingegen freute sich, Anfang dieser Woche mitzuteilen, dass sein Llama-KI-Modell eine Milliarde Mal heruntergeladen wurde.

Trump vs. Öffentliche Bibliotheken

Gizmodo (2)
© Bluesky / Michael Livingston

Während das Gesetz noch nicht geklärt hat, ob die Nutzung von urheberrechtlich geschützten Daten durch KI legal ist, ist klar, wo die kreative Gemeinschaft steht. Michael Chabon verklagte Meta, weil seine urheberrechtlich geschützten Werke zur Schulung von KI verwendet wurden. Die neuesten Enthüllungen von The Atlantic haben bei Autoren für Unmut gesorgt. Autor Michael Livingston schrieb auf Bluesky, dass 16 seiner Bücher und weitere Artikel für das Training von Llama 3 verwendet wurden. Nebula-preisgekrönte Autorin Aliette de Bodard sagte: „All meine Bücher sind in LibGen, und das gefällt mir nicht.“

Bibliotheken kämpfen ums Überleben

Gizmodo (1)
Keith Sonderling, U.S. President Donald Trump’s nominee as the Deputy Secretary of Labor and acting director of the IMLS. © Win McNamee / Getty Images

Das Paradoxe beim Raubkopieren von Büchern zur Ausbildung von KI wird noch deutlicher, da die Regierung unter Präsident Donald Trump daran arbeitet, die finanzielle Unterstützung für öffentliche Bibliotheken zu zerstören, während sie sich auf KI für viele Dienstleistungen stützt, die traditionell von Menschen erbracht werden. Am 14. März erließ Trump eine Executive Order, die das Institute of Museum and Library Services effektiv abschaffen würde. Wie der Name schon sagt, bietet die Agentur Zuschüsse und andere Finanzierungen für öffentliche Bibliotheken in den USA. Am Donnerstag ernannte Trump Keith E. Sonderling zum amtierenden Direktor der IMLS.

Staatliche und lokale Steuern helfen normalerweise, Bibliotheken zu finanzieren, aber viele Einrichtungen in den USA sind auf Bundeszuschüsse für grundlegende Dienste angewiesen. Dies erstreckt sich auch auf die von Bibliotheken geförderten Digitaldienste, welche uns Apps wie Libby und Hoopla liefern, mit denen Benutzer E-Books oder Hörbücher aus ihren lokalen Bibliotheken ausleihen können. Der Präsident von Hoopla Digital, Jeff Jankowski, sagte gegenüber NPR, dass ohne Bundesfinanzierung einige Bibliotheken ihre digitalen Dienste reduzieren oder einstellen könnten. Rechnen Sie mit längeren Wartezeiten, bis E-Books verfügbar sind, oder stellen Sie fest, dass das Buch, das Sie lesen wollten, überhaupt nicht verfügbar ist.

Tech-Oligarchen und die Zukunft der Literatur

Musk und DOGE glauben offenbar, dass die Ersetzung entlassener Mitarbeiter durch KI die Regierung effizienter machen könnte. Sicher, Chatbots können iterative Antworten basierend auf einem Prompt nachahmen, aber es ist unwahrscheinlich, dass KI das leisten kann, was eine voll ausgestattete Bundesbehörde tun kann. Das Ergebnis all dieser Einmischungen durch Tech-Oligarchen wird unsere Zugangsmöglichkeiten zur Literatur einschränken, zuerst indem sie der Buchbranche schaden, indem sie die Werke der Autoren stehlen, und dann indem sie den Zugang der Menschen zu Büchern insgesamt beschränken.

Diese Geschichte teilen

Verwandte Artikel