KI und Bauwirtschaft – unnötig Stress oder große Chance? Im letzten KI-Beitrag ging es um die Einführung der neuen EU-Verordnung (AI Act), die hauptsächlich darauf abzielt, Künstliche Intelligenz im Hinblick auf „Transparenz“ zu regulieren. Doch welche Auswirkungen hat diese Verordnung, insbesondere auf die Bauwirtschaft? Hier gleich die enttäuschende Antwort: Das lässt sich nicht eindeutig sagen. Die KI-Verordnung regelt nicht alle Aspekte rund um das Thema KI. Es kommen zum Beispiel auch Bestimmungen aus dem Urheberrecht, dem Datenschutzrecht und dem Produkthaftungsrecht ins Spiel. Der Tatsache, dass der AI Act Künstliche Intelligenz innerhalb der EU regulieren soll, steht gegenüber, dass die derzeit meistgenutzten KI-Modelle aus Regionen außerhalb der EU (konkret aus den USA) stammen. Im Rahmen der KI-Verordnung müssen KI-Entwickler unter anderem die Trainingsdaten der verwendeten KI-Modelle transparent offenlegen (vorausgesetzt, die Verordnung gilt für die jeweilige KI, die in der EU eingesetzt wird). Die Reaktion der US-amerikanischen Tech-Giganten auf die EU-Regulierung dürfte kaum positiv ausfallen. So plant Meta (früher Facebook) nach aktuellem Stand, die neueste Version seines Sprachmodells „LLaMA“ nicht in der EU zur Verfügung zu stellen. Andererseits könnte dies die Entwicklung von „AI made in Europe“ fördern. Ausgerechnet OpenAI (Entwickler von ChatGPT) ist doch sehr verschlossen, was die verwendeten Trainingsdaten angeht. Was hat es mit den diesen Daten auf sich? Lassen wir die rechtlichen Aspekte beiseite und tauchen tiefer in das Thema Daten und KI-Training ein. In unserer Welt gibt es nahezu unendlich viele Informationen, die aus den unterschiedlichsten Quellen stammen können (z. B. durch Messen und Beobachten). Wir versuchen stets, diese Informationen zu speichern und weiterzugeben. Durch diesen Prozess entstehen „Daten“. Ein Beispiel dafür ist ein Datensatz in Form einer Tabelle mit Spalten und Zeilen, der Informationen über etwas enthält (z. B. eine einfache Excel-Tabelle). Wenn man etwas beobachtet, kann es verschiedene Merkmale aufweisen. Diese Merkmale (auch Features genannt) werden in den Spalten der Tabelle dargestellt. Die jeweiligen Beobachtungen entsprechen den Zeilen. Der Schnittpunkt eines bestimmten Merkmals mit einer bestimmten Beobachtung wird als Datenpunkt bezeichnet. Daten in diesem Format sind „strukturierte“ Daten (geordnet). Viele andere Daten sind jedoch nicht strukturiert (z. B. Bilder, Videos, Audios und Dokumente). In diesem Fall sprechen wir von „unstrukturierten“ Daten. Die Daten selbst bestehen entweder aus Zahlen (numerische Daten) oder Wörtern (kategorische Daten). Diese unterschiedlich strukturierten Daten werden dem jeweiligen ML-Algorithmus zum Training zur Verfügung gestellt. Das Maschinelle Lernen (ML) kennt folgende Lernarten: Überwachtes Lernen, unüberwachtes Lernen und verstärkendes Lernen. Wichtig…