(von Thomas Schreiber)
Einen markanten Einschnitt im Zusammenhang mit der Beschäftigung zu Künstlicher Intelligenz stellte die Veröffentlichung des allgemein verfügbaren Online-Services "ChatGPT" durch das Unternehmen OpenAI im November 2022 dar. Inhaltlich beschreibt sich ChatGPT selbst als
ein künstlicher Intelligenz (KI)-basierter Textgenerator, der vielfältige Anwendungsmöglichkeiten bietet und in der Lage ist, komplexe und natürlichsprachige Texte in hoher Qualität zu verfassen oder auf Eingaben zu reagieren. Die besondere Fähigkeit von ChatGPT besteht darin, menschenähnliche Dialoge zu führen und Informationen zu verarbeiten.
Bereits drei Monate nach dem Launch erreichte ChatGPT im Februar 2023 über 100 Millionen monatlich aktive Nutzer:innen und stellte damit einen Wachstumsrekord in der Kategorie der an Konsument:innen ausgerichteten Online-Services auf.¹ Zuerst ausschließlich in einer kostenlosen und eingeschränkten Version verfügbar, bietet das Unternehmen unter dem Namen "ChatGPT Plus" seit Februar 2023 eine kostenpflichtige Version auch in Österreich an, die sich etwa durch eine höhere Verfügbarkeit abgrenzt.
Während die Basistechnologie "GPT-3" schon 2020 veröffentlicht wurde und bereits damals über die guten Ergebnisse berichtet wurde, richtete sich OpenAI damit noch vorrangig an Entwickler:innen. Erst ChatGPT, mit der Einführung des nunmehr bekannten Chat-Systems und einer einfach bedienbaren Nutzeroberfläche, erreichte eine enorm breite öffentliche Aufmerksamkeit. So beschäftigt sich derzeit kaum ein Tätigkeitsfeld nicht mit dem dadurch erneut erwachten Interesse an künstlicher Intelligenz². Obwohl der Gesamtbereich "KI" deutlich über den Teilbereich der generativen KI, dessen Vertreter ChatGPT ist, hinausgeht, lässt sich die starke Korrelation der Einführung von ChatGPT mit dem allgemeinen Interesse an Künstlicher Intelligenz beispielsweise bereits an Google Trends gut erkennen:
Als Sprachmodell ist ChatGPT in der Lage, insbesondere sprachliche Aufgaben wie Übersetzungen, Zusammenfassungen und Umformulierungen gut zu lösen. Mangels einer Wissensdatenbank im engeren Sinne verfügt ChatGPT (bzw. das dahinterstehende GPT3.5-Modell) zwar über eine breite Wissensbasis, ist aber für tiefergehende Recherchezwecke derzeit eher nicht geeignet. Insbesondere die Möglichkeit, dass es zu s.g. "Halluzinationen" kommt, sollte bedacht werden, wenn faktische Antworten von ChatGPT verwendet werden sollen. Diese bezeichnen die Tatsache, dass ChatGPT zeitweise vollkommen logisch klingende und überzeugt formulierte Sätze ausgibt, die einer Nachrecherche aber nicht standhalten, da sie frei erfundene Informationen beinhalten. Oft ist ChatGPT zwar mittlerweile in der Lage, seine eigenen Grenzen zu erkennen und dementsprechend ausweichend zu antworten, nachrecherchiert sollten Antworten dennoch werden.
Ein Beispiel, wie ChatGPT plausibel klingende Sätze erzeugt, die einer inhaltlichen Nachprüfung aber nicht standhalten, ist etwa folgende Rechercheanfrage⁴:
Nutzereingabe: Führe drei wichtige Urteile des OGH zum Thema Telekom in Österreich an, die sich in deiner Wissensbasis befinden.
ChatGPT: "Als Sprachmodell basierend auf GPT-3.5 habe ich Zugriff auf Informationen bis September 2021 und kann daher keine spezifischen Urteile des österreichischen Obersten Gerichtshofs (OGH) aus einem späteren Zeitraum nennen. Dennoch kann ich Ihnen einige wichtige Entscheidungen des OGH im Zusammenhang mit Telekommunikation in Österreich bis 2021 präsentieren:
Bitte beachten Sie, dass die genannten Urteile auf der Grundlage meiner Trainingsdaten bis September 2021 wiedergegeben wurden und dass sich seitdem weitere relevante Entscheidungen des OGH zum Thema Telekommunikation in Österreich ergeben haben könnten. "
So lesen sich die gelieferten Zusammenfassungen nicht gänzlich unplausibel, genauso wie die Syntax der Geschäftszahlnummer auf den ersten Blick korrekt aussieht. Auch die Aufgabenstellung wurde richtig erkannt: Es wurde der OGH als Oberster Gerichtshof identifiziert, und es wurden genau drei "Urteile" zurückgegeben. Bei genauerer Recherche stellt sich allerdings dann heraus, dass kein einziges der genannten Urteile tatsächlich existiert – alle aufgelisteten Verfahren sind frei erfunden. Zwei der Geschäftszahlen existieren zwar, beinhalten aber andere Urteile, die dritte Geschäftszahl wiederum ist nicht vergeben.
Was im Gegensatz zu Recherche aber gut funktioniert, sind rein sprachliche Aufgaben oder die Abfrage von Oberflächenwissen. Eingaben wie "Liste fünf Vorschläge für passende Tweets zu folgendem Text" oder "Formuliere zwei Vorschläge für LinkedIn-Posts für ein juristisch-technisches Publikum zu folgender Pressemitteilung" setzen kein Detailwissen voraus, eine Überarbeitung ist dennoch oft notwendig. Hilfestellungen, die dieses "Prompt Engineering" erleichtern sollen, bietet der Anbieter selbst an.⁵
In Anbetracht der Entwicklungsgeschwindigkeit und der allgegenwärtigen Integration der ChatGPT zugrundeliegenden Technologien ist absehbar, dass aktuelle Schwächen künftig, zumindest teilweise, ausgeglichen werden könnten. So verfügt das Nachfolgemodell "GPT-4" über eine Plugin-Architektur, die es ihm erlaubt, beispielsweise mathematische Fragestellungen an externe Services auszulagern. Eine Integration in Microsoft Bing ermöglicht es, fehlende Informationen selbstständig aus dem Internet zu beziehen und in die Fragebeantwortung einfließen zu lassen. Angekündigte Integrationen in E-Mail- und Office-Software scheinen den Zugang zu generativer KI noch niedrigschwelliger zu gestalten.
Hinsichtlich der Vertraulichkeit der übermittelten Daten weist OpenAI (Firmensitz in San Francisco) darauf hin, dass standardmäßig alle ChatGPT-Unterhaltungen für weiteres Training verwendet werden können und dadurch keine Vertraulichkeit gewährleistet ist. Ein Opt-Out aus der Verwendung von Daten sei allerdings möglich.⁶ Für die Nutzung des an Entwickler:innen gerichteten Application Programming Interface ("API") sichert OpenAI grundsätzlich Vertraulichkeit zu. Neben OpenAI als Unternehmen bietet auch Microsoft als Vertriebspartner über die "Microsoft Azure"-Cloud Zugriff auf die OpenAI-API an, wobei hier eine Einschränkung auf europäische Rechenzentren möglich ist, und Microsoft direkt als Vertragspartner auftritt⁷.
Im Falle der Verwendung der API gelten dieselben strategischen Überlegungen wie bei anderen API-Nutzungen – so ist, anders als bei Open Source AI-Lösungen, ein eigenes Hosting nicht möglich, weshalb unter Umständen ein Wechsel des Anbieters in Zukunft schwierig sein kann. Diese Bedenken werden zum Teil vom kommenden EU-Datengesetz abgedeckt.
Zusammenfassend bietet ChatGPT einen guten Einblick in den aktuellen Stand der Technik bei generativer künstlicher Intelligenz. Die Verfügbarkeit eines kostenlosen Angebots lädt zur Benutzung der AI ein, wenngleich alle Ergebnisse einer Nachprüfung bedürfen und insbesondere hinsichtlich der Datenvertraulichkeit Vorsicht geboten ist.
² Als Beispiel sei der juristische Bereich genannt – Bereits auf dem im Februar stattgefundenen Internationalen Rechtsinformatik-Symposium in Salzburg widmeten sich nicht weniger als 11 verschiedene Vorträge den verschiedenen Aspekten des Einsatzes von ChatGPT.
³https://trends.google.de/trends/explore?date=today%205-y&q=%2Fg%2F11rsc2xsp1,%2Fm%2F0mkz&hl=de
⁴https://chat.openai.com/share/cd45b6cf-7728-41e8-ae7b-9810988bf30c, ChatGPT May 24 Version
⁵https://help.openai.com/en/articles/6654000-best-practices-for-prompt-engineering-with-openai-api
⁶https://openai.com/policies/terms-of-use