8
0
1
.8
0
1
2
3
4
5
6
7
8
9
0
1
2
3
4
8
0
5
0
5
9
4
9
4
9
4
9
3
8
3
8
3
8
3
8
2
7
2
7
2
7
2
6
1
6
1
8
0
3
5
8
0
3
6
8
1
4
6
9
1
4
7
9
2
5
7
0
2
5
8
0
3
6
8
1
3
6
9
1
4
6
9
2
4
7
0
2
5
7
0
3
9
GEPRÜFTE BAUSTELLEN IM JAHR
Vorsicht bei diesen Firmen  Spenden gegen Pfusch am Bau  Newsletter abonnieren  Bessere-Welt-Prämie

Um Daten auszuwerten, gibt es viele Möglichkeiten. Für sehr große Datenmengen, wie sie in populären Chatbots (z. B. ChatGPT) vorkommen, werden sogenannte neuronale Netzwerke (NN) eingesetzt. Zur Wiederholung: Maschinelles Lernen ist ein Teilgebiet der künstlichen Intelligenz (KI). Das maschinelle Lernen umfasst unterschiedliche Algorithmen, um eine KI zu „trainieren“. Die modernsten KI-Modelle basieren auf NN, die als Teil des maschinellen Lernens genutzt werden. Ziel eines jeden Lernalgorithmus ist es, auf Basis gegebener Eingabe- und Ausgabedaten ein Vorhersagemodell zu entwickeln, das auch auf neue, unbekannte Eingabedaten angewendet werden kann. Warum neuronale Netzwerke Regeln selbst entwickeln Die „Regeln“ für dieses Vorhersagemodell werden jedoch nicht vom Menschen (also dem Programmierer) selbst geschrieben. Ein Beispiel für solche Regeln wären typische Wenn-Dann-Beziehungen, wie etwa: „Wenn Sensor nass, dann Fenster schließen.“ In unserer komplexen Welt ist es für einen Menschen (auch aus Zeitgründen und vielen Unsicherheiten) nicht möglich, Regeln für jede denkbare Situation zu verfassen. Daher überlassen wir in vielen Fällen neuronalen Netzwerken (NN) die Aufgabe, diese komplexen Regeln zu entwickeln (beispielsweise Regeln, die es einem Computer ermöglichen, selbstständig ein Bild von einer Brücke zu erkennen). NN sind in der Lage, Muster und Beziehungen zwischen Eingabe- und Ausgabedaten zu erkennen, um daraus zahlreiche Regeln für einen spezifischen Anwendungsfall (wie etwa die Bilderkennung) abzuleiten. Das Konzept neuronaler Netzwerke Gehen wir auf das Konzept hinter neuronalen Netzwerken (NN) ein. Unser Gehirn besteht aus zahlreichen Nervenzellen (Neuronen), die untereinander Informationen austauschen. Ein Neuron erhält einen Input (einen elektrischen Impuls) und leitet dieses Signal (die Information) an verbundene Neuronen weiter, wenn ein bestimmter „Schwellenwert“ erreicht wird (das Neuron „feuert“). Diese verbundenen Neuronen können wiederum so erregt werden, dass sie das eingehende Signal an weitere Neuronen weiterleiten oder nicht (der Output eines Neurons wird zum Input des nächsten Neurons). Schließlich führt das „Feuern“ bestimmter Neuronen untereinander zu einer Ausgabe (z. B. „Ich habe das verstanden!“). Diese Prozesse im Gehirn laufen wahnsinnig schnell und kontinuierlich ab. Künstliche neuronale Netzwerke (NN) orientieren sich an diesem Konzept, haben jedoch nur bedingt Ähnlichkeit mit dem biologischen Gehirn. Das einfachste neuronale Netzwerk ist in Abbildung 1 dargestellt. Deep Learning: Die Komplexität neuronaler Netzwerke verstehen Ein neuronales Netzwerk (NN) ist in der Praxis deutlich komplexer aufgebaut, als es hier dargestellt wird. Das vorliegende NN verfügt über eine Eingabe- und eine Ausgabeschicht, die jeweils eine bestimmte Anzahl von Neuronen enthalten. Tatsächlich befinden sich in einem NN zwischen der Eingabe- und der Ausgabeschicht zahlreiche sogenannte „versteckte Schichten“ (hidden layers),…

Weiterlesen

Bereits im ersten Beitrag wurde die derzeit bekannteste Künstliche Intelligenz „ChatGPT“ von OpenAI erwähnt. Laut der neuen KI-Verordnung (AI-Act) handelt es sich dabei um sogenannte KI-Modelle mit allgemeinem Verwendungszweck (General Purpose AI Models, kurz: GPAI-Models). Diese Modelle werden nicht für eine spezifische Aufgabe entwickelt und können daher flexibel für zahlreiche Anwendungen in der Verarbeitung und Generierung unstrukturierter Texte, Bilder, Audios und Videos eingesetzt werden. In einem der vorherigen Beiträge wurde die Unterscheidung von KI in „starke“ KI (auf einer Ebene mit dem Menschen) und „schwache“ KI (nur für eine spezifische Aufgabe ausgelegt) erläutert. GPAI-Modelle bewegen sich zwischen diesen Kategorien, werden jedoch eher als fortschrittliche „schwache“ KI betrachtet. Mit welchen GPAI-Modellen haben wir es also zu tun und wie funktionieren diese? Hinter dem uns bekannten Chatbot „ChatGPT“ von OpenAI steckt ein komplexes „Transformer-Modell“, das zu den GPAI-Modellen (laut AI Act) gezählt werden kann und übergeordnet als „Large Language Model“ (LLM, „großes Sprachmodell“) bezeichnet wird. Diese Transformer basieren auf fortschrittlichen neuronalen Netzwerken, die in den nächsten Beiträgen näher betrachtet werden. Die Sprachmodelle hinter ChatGPT heißen beispielsweise GPT-4 oder GPT-4o (veraltet ist GPT-3.5). GPT steht für „Generative Pre-trained Transformer“. Kurz gesagt: Das Modell wurde vorher mit großen Datensätzen trainiert und kann bei einer neuen Eingabe die Beziehungen zwischen Wörtern in einem Satz erkennen, um so einen passenden Output zu generieren. Der Begriff ChatGPT bezeichnet „nur“ die Benutzeroberfläche bzw. die Chatbot-App, über die Menschen mit dem Sprachmodell interagieren können. Mittlerweile sind die typischen Sprachmodelle nicht mehr nur Sprachmodelle, sondern vielmehr „multimodale“ Modelle. Neben der Fähigkeit, Sprache bzw. Texte zu verarbeiten, verfügen sie auch über weitere „Modi“ wie die Audio- und Bildverarbeitung. Sprache in Form von Texten war in den veralteten Modellen wie GPT-3.5 der einzige „(Daten-)Modus“. Die Modelle von OpenAI (z. B. GPT-4) sind jedoch nicht die einzigen großen KI-Modelle. Beispielsweise gibt es auch KI-Modelle von Meta AI (Llama 3.1-405B), Mistral AI (Mistral Large 2), Google DeepMind (Gemini 1.0 Ultra) oder Anthropic (Claude 2). Diese KI-Modelle sind jeweils im Hintergrund einer eigenen Benutzeroberfläche implementiert. Die Benutzeroberfläche (die Chatbot-App) für Mistral Large 2 heißt „le Chat“. Die Unterscheidung zwischen dem KI-Modell (z. B. GPT-4 oder Mistral Large 2) und der Benutzer-App (z. B. ChatGPT oder le Chat) ist wichtig, da die KI-Modelle für die Anwendungen im eigenen Unternehmen von Bedeutung sind. Der Chatbot „Microsoft Copilot“ nutzt beispielhaft ebenfalls das Sprachmodell GPT-4. Es ist wichtig, die Eigenschaften dieser unterschiedlichen Modelle zu erkennen, da sie sich rasant weiterentwickeln…

Weiterlesen