Natürlich künstlich intelligent recherchieren
Dieser Artikel erschien vor einigen Monaten im Magazin Nitro. Leider wurde er sehr lieblos und ohne funktionierende Links auf die Website gestellt. Auch kann man nicht unterscheiden zwischen dem, was ich geschrieben habe und dem, was von der KI stammt. Hier also eine Version, wie ich es gemacht hätte.
Es ist verführerisch: Man sitzt vor dem Monitor, und es fällt einem nichts ein. Da gab es doch… genau! Wir bitten einfach die künstliche Intelligenz, einen Artikel zu schreiben und zu recherchieren. Wem würde das auffallen?
Da fängt es schon an. Wer einen eigenen, erkennbaren Stil hat, wird den nicht wiederfinden. Und gar Ironie? Die künstliche Intelligenz ist so homorlos wie ein woker Hipster mit Gendersternchen auf der Zunge. Aber könnten wir das KI-Ergebnis als Vorlage nehmen, also Zeit sparen?
Also fragen wir ChatGPT: Welche Inhalte und Themen müsste ein Artikel behandeln, der den Titel trägt „Investigative journalistische Recherche im Internet mit Hilfe von Künstlicher Intelligenz“?
Jetzt rasseln gleich die Phrasen wie von einem Sprachblasenfacharbeiter einer Werbeagentur: Ein Artikel mit dem Titel „Investigative journalistische Recherche im Internet mit Hilfe von Künstlicher Intelligenz“ sollte eine Vielzahl von Themen und Inhalten abdecken, um den Lesern einen umfassenden Überblick über die Anwendung und den Nutzen von KI im Bereich des investigativen Journalismus zu bieten.
Schön, das hätten wir mit natürlicher Intelligenz auch irgendwie erraten. Wolf Schneider würde anmerken: Eine Vielzahl von Themen und Inhalten ist so abgedroschen und inhaltsleer, dass man sich eine halbe Stunde mit der Lektüre von Schillers „Glocke (Verben! Verben! Verben!) erholen muss.
Hier sind einige wichtige Punkte, die der Artikel behandeln sollte (Genau! Die unwichtigen Punkte behandeln wir ausnahmsweise nicht!): Einleitung: Definition und Bedeutung des investigativen Journalismus: Erläuterung, was investigativer Journalismus ist und warum er wichtig ist. Einführung in Künstliche Intelligenz (KI): Grundlegende Erklärung von KI und deren allgemeine Anwendungen.
Hier schon wenden sich die ersten Leser mit Grauen ab und den unterhaltsameren sozialen Medien zu. Journalisten, die erläutern, warum Journalismus wichtig ist – das klingt so, als gäbe es Journalisten, die sich gegenseitig Preise verleihen – wie albern ist das denn? (Sorry, falls jemand hier einen Journalistenpreis bekommen hat.)
– Anwendungsbereiche der KI im investigativen Journalismus
• Datenanalyse: Wie KI große Datenmengen analysieren und Muster erkennen kann, die menschliche Journalisten möglicherweise übersehen würden.
• Automatisierung von Routineaufgaben: Einsatz von KI zur Automatisierung von Aufgaben wie Datenreinigung, Transkription von Interviews und Übersetzungen.
• Textanalyse und -verarbeitung: Verwendung von Natural Language Processing (NLP) zur Analyse und Interpretation von Texten, Dokumenten und sozialen Medien.
• Bild- und Videoanalyse: Einsatz von KI zur Analyse und Verifizierung von Bildern und Videos, einschließlich Gesichtserkennung und Objekterkennung.
Das akzeptieren wir, zumal Journalisten, die zugeben, dass sie etwas übersehen können, schon weitaus selbstkritischer sind als die Mehrheit der Zunft. Aber was genau ist gemeint? Im Sinn: Wir fragen die KI gleich noch einmal.
– Vorteile und Nutzen
• Effizienzsteigerung: Wie KI die Effizienz und Produktivität von Journalisten steigern kann.
• Erweiterung der Recherchemöglichkeiten: Neue Möglichkeiten und Perspektiven, die durch KI eröffnet werden.
• Verbesserung der Genauigkeit: Erhöhung der Genauigkeit und Zuverlässigkeit von Recherchen durch die Analyse großer Datenmengen und das Erkennen von Fehlern oder Unstimmigkeiten.
Das ChatGPT, ist, mit Verlaub, Gelaber. Effizienz, um den tendenziellen Fall der Profitrate des Kapitals aufzuhalten? Oder mehr Zeit für den Nachwuchs zu haben, der sich per Smartphone online mit künstlicher Intelligenz beschäftigt? Mehr Produktivität bei gleicher Bezahlung – wo kämen wir denn da hin?! Neue Möglichkeiten und Perspektiven vgl. Vielzahl von Themen und Inhalten – zertrümmere die Sprechblasen der alten Unmöglichkeiten und Sichtweisen!
Danach listet ChatGPT die Herausforderungen und Risiken auf – die dürfen auf keinen Fall fehlen und sind überall, auch wo man sie nicht erwartet, etwa bei Grabrednern: Der Tod als Herausforderung und Risiko. Den Abschnitt lassen wir ganz weg.
Erfolgreiche Projekte: Beispiele von investigativen Recherchen, die durch den Einsatz von KI erfolgreich waren. Das hört sich spannend an. ChatGPT: Nenne Beispiele von investigativen Recherchen, die durch den Einsatz von KI erfolgreich waren!
Es gibt mehrere bemerkenswerte Beispiele, bei denen Künstliche Intelligenz (KI) erfolgreich in investigativen Recherchen eingesetzt wurde:
Panama Papers: 2016 deckten die Panama Papers ein komplexes Netzwerk von Offshore-Konten und Briefkastenfirmen auf, die von Politikern, Prominenten und Geschäftsleuten genutzt wurden. Einsatz von KI: Das International Consortium of Investigative Journalists (ICIJ) nutzte KI-gestützte Tools, um Millionen von Dokumenten zu durchsuchen und Verbindungen zwischen verschiedenen Entitäten zu erkennen. Diese Tools halfen dabei, Muster und Netzwerke zu identifizieren, die sonst schwer zu entdecken gewesen wären.
Paradise Papers: Hintergrund: 2017 wurden die Paradise Papers veröffentlicht, die ähnliche Offshore-Finanzstrukturen wie die Panama Papers aufdeckten.
Einsatz von KI: Auch hier setzte das ICIJ KI-Technologien ein, um die Daten zu analysieren und Verbindungen aufzudecken. Diese Technologie ermöglichte es, große Mengen unstrukturierter Daten effizient zu durchsuchen und relevante Informationen zu extrahieren.
Project Daphne: Nach dem Mord an der maltesischen Journalistin Daphne Caruana Galizia setzten Journalisten KI ein, um ihre investigativen Arbeiten fortzusetzen. Einsatz von KI: KI-Tools halfen dabei, große Mengen an Dokumenten, E-Mails und anderen Datenquellen zu analysieren, die sie gesammelt hatte. Dadurch konnten Verbindungen und Verdächtige identifiziert werden, die zur Aufklärung des Falls beitrugen.
Investigative Data Mining bei Bloomberg: Bloomberg News nutzt fortschrittliche KI-Algorithmen, um verdächtige Handelsaktivitäten und Marktmanipulationen zu erkennen. Einsatz von KI: Durch den Einsatz von Machine Learning und Datenanalysetechniken konnten Muster in Handelsdaten entdeckt werden, die auf illegale Aktivitäten hinwiesen. Dies führte zu mehreren aufsehenerregenden Berichten über Marktmanipulation.
Human Rights Investigations: KI-gestützte Bild- und Videoanalyse-Tools werden verwendet, um Beweise für Kriegsverbrechen und andere Menschenrechtsverletzungen zu sammeln und zu verifizieren. Diese Technologien helfen, große Mengen an visuellem Material schnell zu durchsuchen und relevante Beweise zu identifizieren.
Tools und Technologien: Vorstellung spezifischer KI-Tools und -Plattformen, die im investigativen Journalismus genutzt werden (z.B. IBM Watson, Google Cloud AI, etc.).
Das müssen wir uns näher anschauen – warum sollte man den Tipps der Künstlichen Intelligenz glauben, zumal niemals herauszufinden sein wird, woher die stammen und ob irgendjemand das überprüft hat?
dynamic group of investigative journalists collaborating in a high-tech workspace filled with futuristic tools and screens. The scene showcases their innovative approach to uncovering hidden truths, with AI-powered systems analyzing data, generating visualizations, and scanning through documents in real-time. Each journalist is engaged in a unique task, from coding algorithms to writing reports, all while surrounded by holographic displays of information, maps, and charts. The setting combines traditional elements of journalism, like notebooks and cameras, with cutting-edge technology, emphasizing their seamless integration of AI in investigative research. –ar 3:2
1. Natural Language Processing (NLP) umfasst eine Reihe von Funktionen und Techniken, die es Computern ermöglichen, menschliche Sprache zu verstehen, zu interpretieren und darauf zu reagieren. Und: Die Entitätsidentifikation, auch bekannt als Named Entity Recognition (NER), ist eine zentrale Funktion im Bereich des Natural Language Processing (NLP). Sie umfasst die Erkennung und Klassifizierung von Entitäten (d.h. spezifischen Informationseinheiten) in Texten.
Ḿan kann das Tools kostenlos testen. Aber warum sollte man für etwas bezahlen, was man selbst besser kann? Vielleicht könnte das virtuelle Werkzeug etwa für Kriminalisten sein, die sich bei fremdsprachlichen Texten, wie zum Beispiel Indonesisch oder Chinesisch, einen ersten Eindruck verschaffen können, mit was sie es zu tun haben. Ein Freiberufler kann sich die Kosten vermutlich nur selten leisten. Hier ist natürliche Intelligenz preiswerter.
Und wenn die künstliche Intelligenz unstrittig Ironie und Sarkasmus nicht versteht – wie kann sie dann richtig interpretieren oder gar reagieren? Nur zu, künstliche Intelligenz! Welche Entität identifizierst du hier – und wie reagierst du? „An einem Juni-Morgen des Jahres 1872 erschlug ich meinen Vater – eine Tat, die damals tiefen Eindruck auf mich machte.“ (Ambose Bierce: An Imperfect Conflagration: „Early one June morning in 1872 I murdered my father an act which made a deep impression on me at the time.“) Tipp: Damals?
2. Diese Einwände gelten auch für IBM Watson Natural Language Understanding: Ein KI-Tool von IBM, das NLP-Funktionen wie Schlüsselwortextraktion, Entitätsidentifikation und Sentimentanalyse ermöglicht.
3. OpenAI GPT-3: Eine leistungsstarke KI-Plattform, die Sprachgenerierung und -analyse ermöglicht. Es kann verwendet werden, um Fragen zu beantworten, Texte zu verstehen und sogar kreative Inhalte zu generieren.
Da muss ich widersprechen, ChatGPT! Die Version 4.0 deiner selbst ist bei vielen Informationen um Klassen besser als die älteren Varianten. Das wird sich noch weiter verbessern – aber die grundsätzlichen Probleme sind damit nicht aus der Welt. Kreativ ist das alles nicht, auch wenn wir das Buzzword „kreativ“ durch „schöpferisch“ ersetzen, damit wir nicht immer an Volkshochschulkurse denken müssen.
4. Maltego („The World’s Most Used Cyber Investigation Platform“): Ein Open-Source-Tool für die Informationsgewinnung und Datenvisualisierung, das bei der Analyse von Beziehungen zwischen Personen, Organisationen und anderen Entitäten hilft.
Nachfrage an ChatGPT: Erkläre, wie die Software Maltego zum Analysieren von Daten funktioniert!
– Datenakquisition (Transformen): Maltego verwendet sogenannte „Transformen“, um Daten aus verschiedenen Quellen zu sammeln. Diese Transformen sind vordefinierte Skripte, die bestimmte Arten von Informationen abrufen können.
Beispiele: Transformen können verwendet werden, um Informationen wie Domain-Namen, IP-Adressen, soziale Medienprofile, E-Mail-Adressen, Telefonnumern und vieles mehr zu extrahieren.
– Datenvisualisierung: Die gesammelten Daten werden in Form von Graphen visualisiert. Diese Graphen zeigen Entitäten (Datenpunkte) und deren Verbindungen (Beziehungen) zueinander.
Beispiele: Ein typischer Graph kann die Beziehung zwischen einer IP-Adresse und den dazugehörigen Domain-Namen, E-Mail-Adressen und sozialen Medienprofilen darstellen.
– Interaktive Analyse: Benutzer können die Graphen interaktiv erkunden, indem sie auf einzelne Entitäten klicken, um detaillierte Informationen anzuzeigen, oder neue Transformen anwenden, um zusätzliche Daten zu sammeln.
Beispiele: Durch Klicken auf eine E-Mail-Adresse kann der Benutzer Transformen anwenden, um zu sehen, welche sozialen Medienprofile mit dieser E-Mail-Adresse verknüpft sind.
Maltego macht das, was Google und Facebook auch tun: Alle Daten, die Nutzer öffentlich im Internet hinterlassen, zu sammeln, zu ordnen und sogar zu visualisieren. Das konnten versierte Rechercheure vorher auch schon, wenn man weiß, was Tracerouting ist oder wie man zum Beispiel Nutzerprofile erstellt – sogar im Usenet (die KI kann das Usenet nicht indizieren), wie man den Inhaber von Domains und Subdomains herausfindet und wie man IP-Adressen zuordnet. Bisher war das aber eine mühselige Puzzlearbeit und wird durch Maltego erleichtert.
Bonus: Die Software kann heruntergeladen werden, sogar für das Betriebssystem Linux, und gratis verwendet werden. Die kostenpflichtige Version bietet erheblich mehr Features.
Nachfrage an ChatGPT: Gibt es kostenlose Software, die die Beziehungen von Nutzern sozialer Medien visualisieren kann? Antwort:
Gephi, NodXL, SocNetV (Social Networks Visualizer), Netlytic, Pajek.
5. TensorFlow: Eine Open-Source-Maschinenlernbibliothek, die es Benutzern ermöglicht, eigene KI-Modelle zu entwickeln und anzupassen, um spezifische Rechercheziele zu erreichen.
Hier müssen wir passen: Die Software selbst zu programmieren und den eigenen Bedürfnisse anzupassen, ist nur etwas für Leute, die bei der Zeile model.compile(optimizer=’adam‘, loss=’sparse_categorical_crossentropy‘ verständnisvoll mit dem Kopf nicken. Das gilt auch für
6. Scrapy: Ein Python-Framework für das Web-Scraping, das es Benutzern ermöglicht, strukturierte Daten aus Websites zu extrahieren.
7. Hunchly („Automatic Preservation of Websites and Social Media“): Eine Software für das Webseiten- und Quellenverfolgung, die es Journalisten ermöglicht, ihre Recherchen zu dokumentieren und Webseiten automatisch zu archivieren (Abonnement ab ca. 110 $ jährlich).
Hier hat ChatGPT selbständig die Frage erweitert und verändert. Für freie Journalisten zu teuer, zumal Dokumentation oder automatisches Speichern von Websites auch anders zu bewerkstelligen sind.
7. InVID Verification Plugin (Chrome Store – eine Browsererweiterung, die von Journalisten verwendet wird, um die Echtheit von Bildern und Videos zu
überprüfen und Metadaten zu analysieren.
Überflüssig und nur für den Browser Chrome. Jedes einigermaßen anspruchsvolle Grafikprogramm kann zum Beispiel die EXIF-Daten eines Fotos auslesen.
8. Bellingcat Online Investigation Toolkit: Ein Toolkit für Online-Recherchen, das verschiedene Ressourcen und Tools für OSINT und Social Media-Verifikation bietet. Vgl. BellingCat Online Investigation Toolkit. Vgl. auch „These are the Tools Open Source Researchers Say They Need“ .
Bellingcat mit Sitz in Amsterdam (NL) ist laut Wikipedia ein nicht-staatliches investigatives Recherchenetzwerk um den Netzaktivisten Eliot Higgins, das sich auf den Faktencheck und Open Source Intelligence (OSINT) spezialisiert. Die Organisation und die ihr manchmal vorgeworfenen Regierungsnähe wäre ein eigenes Kapitel wert. Die Berliner Zeitung warf Bellingcat zum Beispiel vor, sie habe „Satellitenfotos falsch datiert und verändert“.
9. Yandex Translate API: Eine KI-basierte Übersetzungsschnittstelle, die es ermöglicht, fremdsprachige Informationen zu verstehen und zu
analysieren.
Ein Ableger der russischen Suchmaschine Yandex, der angibt, in Serbien beheimatet zu sein und zuerst die IP-Adresse ausliest, um die Sprache des Nutzers einzustellen – was aber nicht funktioniert (error 404). Merke: Putin liest vermutlich mit.
10. Datawrapper: Ein Tool für die Erstellung von interaktiven Grafiken und Diagrammen, um Daten und Ergebnisse visuell darzustellen.
Sehr nützlich, wenn man bei der Frage „Wie möchtest du deine Daten hochladen?“ nicht schon zusammenzuckt.
11. Storyful Open-Source Intelligence (OSINT) Toolkit: Ein Toolset für Journalisten zur Überwachung und Analyse von Social Media-Plattformen und anderen öffentlichen Quellen. „Storyful Intelligence provides a consultative approach to strategic planning, uncovering emerging trends, narratives and influencers across digital platforms to gain competitive advantage in campaign planning, product launches, personnel changes and more.
Fazit: Recherchieren kann Künstliche Intelligenz nicht. Das war zu erwarten. Auch die Tools für die Online-Recherche, die etwa ChatGPT 4.0 aufführt, sind nicht vollständig. (Vgl. „Die 10 besten Open Source Intelligence (OSINT)-Tools„).
Um sich einen ersten Überblick zu verschaffen und Zwischenfragen (wie funktioniert…?) beantworten zu lassen, eignet sich die KI hervorragend und ist hier besser und schneller als Wikipedia.
Kommentare
8 Kommentare zu “Natürlich künstlich intelligent recherchieren”
Schreibe einen Kommentar
Boaahhh!
Das ist mal ein geiler Artikel von Dir,
den ich nachvollziehen kann.
Und stell Dir jetzt die Power in den Händen Superreichen vor, da hat die Demokatie keine
Chance mehr — gegen den Technopool!
Claude übrigens hat mir sogar die Nachrichtenverbindungen zwischen der Stasi und
der Volksarmee in der Köpenicker Oberspreestr.
aufgezeigt (den millitärischen Abschirmdienst
der DDR), die LLM’s dürfen wohl alles lesen.
nicht weahr? :-O
Ne dumme Frage:
Gibt es vom Tagesspiegel-Podcast zwei
Versionen?
mfg
Keine Ahnung – ich kenne nur eine.
Burksmausi, ich habe den Artikel nicht gelesen. Aber es waren die Rechten, die Schuld haben, nicht die vom Verlag.
Ist das ungefähr zutreffend?
hab ich gerade ein Déjà-vu??
hattest du den Artikel schon mal beworben oder gepostet?
egal
KI wird ja für wichtigeres benötigt, wie z.B.
https://www.youtube.com/watch?v=NHVpGZqvJEk
Burkhard meinte:
> Keine Ahnung – ich kenne nur eine.
Interessant. Dann gibts noch nen „Mitspieler“
in dem Podcast.
mfg
Nein.
Admin, nicht schlecht!
Und wer hat dann das Wort „Altvorderen“
gestrichen? :-D
mfg
„Die künstliche Intelligenz ist so homorlos wie ein …“
…ist da nicht ein „r“ zuviel…hx?
PS: Wokestorm bitte wie eh und JEVERschlüsseln.