Eigene Daten im ChatGPT-Stil erforschen: So nutzen Sie Azure OpenAI und Azure Cognitiv Search für interne KI-Lösungen
ChatGPT liefert Erkenntnisse in erstaunlich kreativer Textform, die Inhalte dafür stammen meist aus gängigen Internet-Quellen. Warum also nicht einen intelligenten Sprachautomaten für die Erschließung eigene Dokumente und Informationsquellen nutzen? Tatsächlich liefert Microsoft jetzt alle technischen Voraussetzungen, um Azure OpenAI-Dienste auf der Basis eigener Daten einzusetzen.
Um eine eigene KI-Sprach-Engine einzurichten, die mit den internen Daten einer Organisation arbeitet, stellt Microsoft die beiden folgende Dienste zur Verfügung:
• Azure OpenAI
• Azure Cognitiv Search Index
Zum Aktuellen Zeitpunkt (Juli 2023) befindet sich Azure OpenAI noch in der Vorschauversion. Um es nutzen zu können, muss mach sich für die Preview anmelden. Azure Cognitiv Search ist bereits offiziell verfügbar.
1. Einrichten der Suche mit Azure Cognitiv Search
Als Grundlage für eine solche KI-Lösung werden typische Suchmaschinen-Dienste mit Index und Abfragefunktionen benötigt. Deshalb beginnt die Einrichtung bei Azure Cognitiv Search, wo Sie eine Instanz anlegen müssen. Eine Anleitung dafür finden Sie hier bei Microsoft: Create an Azure Cognitive Search service in the portal (de-de).
Im nächsten Schritt geben Sie an, wo die Daten liegen, die indiziert werden sollen. Dazu gibt es unterschiedliche Optionen, die alle zu einem Index in der neu angelegt Azure Cognitiv Search-Instanz führen. Auf der Überblicksseite finden Sie dazu den Punkt Connect your data -> Learn more, wie hier zu sehen ist:
Um das Ganze zu testen, können Sie auch Demodaten verwenden, die Microsoft dafür bereitstellt. Über den Schaltfläche Import gelangen Sie zu den aktuell verfügbaren Optionen des Datenimports, in unserem Fall mit der Auswahl Samples:
Sofern Sie zu den Anwendern gehören, deren Daten in Microsoft 365, SharePoint Online und Teams liegen, ist die Option SharePoint Online interessant. Aktuell befindet sich diese Option noch in der Vorschauphase und kann nicht über die Konfigurationsoberfläche ausgewählt werden.
Falls Sie dennoch Azure Cognitiv Search verwenden wollen, um Daten in SharePoint Online zu indizieren, finden Sie hier die Beschreibung: Index data from SharePoint document libraries (de-de).
In meinem Beispiel verwende ich die Demodaten hotels-sample, die Microsoft zur Verfügung stellt:
Der Index von hotels-samples enthält folgende Felder:
Die ausgewählten Felder markieren die Daten, die nun in Azure OpenAI genutzt werden können.
2. Konfigurieren der KI-Komponente Azure OpenAI
Zum Start mit Azure OpenAI legen Sie eine Instanz an. Damit steht Ihnen das Azure OpenAI Studio zur Verfügung, inklusive der Option ChatGPT-Playground:
Im ChatGPT-Playground können Sie nun auswählen, mit welchen Daten die KI arbeiten soll. Das können die sein, die das allgemeinen Language Model GPT kennt, oder aber Sie wählen dafür die eigenen Daten aus:
Sofern Sie die eigenen Daten verwenden wollen, die oben im Abschnitt Azure Cognitiv Search gewählt wurde, müssen Sie die entsprechenden Details auswählen:
Das „Index data field mapping“ im nächsten Schritt ist nicht zwingend erforderlich. Allerdings empfiehlt sich die Auswahl, weil damit die Qualität der Antworten deutlich steigt. Im Beispiel mit den „hotels-sample“-Demo Daten sieht die Einrichtung dann so aus:
Sobald Sie das eingerichtet haben, können Sie Texte auf Basis des Large Language Modells GPT und den hinterlegten Daten generieren. Das sieht dann im Beispiel so aus:
Werden beim Einsatz von Azure OpenAI noch Metadaten benötigt?
Die Frage liegt nahe, ist aber falsch gestellt. Denn entscheidend ist, ob die KI Zugriff wirklich alle relevanten Informationen hat. Dazu gehören auch Metadaten.
Das Beispiel im Bild veranschaulicht das Problem. Azure OpenAI kennt die Informationen nicht, obwohl sie in Form von Metadaten vorhanden wären.
- Gefährliche Microsoft 365-Lücke: Wie Sie illegale Zugriffe über Power-Platform-Gastkonten verhindern - 11. September 2023
- Eigene Daten im ChatGPT-Stil erforschen: So nutzen Sie Azure OpenAI und Azure Cognitiv Search für interne KI-Lösungen - 17. Juli 2023
- Mit dem Security Copilot führt Microsoft einen KI-Assistenten für IT-Sicherheit ein - 30. März 2023