Möchten Sie wissen, wie Deep Learning funktioniert? Hier ist eine Kurzanleitung für alle.

Künstliche Intelligenz (KI) und Maschinelles Lernen (ML) sind derzeit einige der heißesten Themen.

Der Begriff „KI“ wird jeden Tag beiläufig herumgeworfen. Sie hören aufstrebende Entwickler sagen, sie wollen KI lernen. Sie hören auch Führungskräfte sagen, dass sie KI in ihre Dienste implementieren möchten. Aber ziemlich oft verstehen viele dieser Leute nicht, was KI ist.

Sobald Sie diesen Artikel gelesen haben, werden Sie die Grundlagen von AI und ML verstehen. Noch wichtiger ist, dass Sie verstehen, wie Deep Learning, die beliebteste Art von ML, funktioniert.

Dieser Leitfaden ist für alle gedacht, daher ist keine fortgeschrittene Mathematik erforderlich.

Hintergrund

Der erste Schritt zum Verständnis der Funktionsweise von Deep Learning besteht darin, die Unterschiede zwischen wichtigen Begriffen zu erfassen.

Künstliche Intelligenz gegen maschinelles Lernen

Künstliche Intelligenz ist die Replikation menschlicher Intelligenz in Computern.

Als die KI-Forschung begann, versuchten die Forscher, die menschliche Intelligenz für bestimmte Aufgaben - wie das Spielen eines Spiels - zu replizieren.

Sie führten eine Vielzahl von Regeln ein, die der Computer einhalten musste. Der Computer hatte eine spezifische Liste möglicher Aktionen und traf Entscheidungen basierend auf diesen Regeln.

Maschinelles Lernen bezieht sich auf die Fähigkeit einer Maschine, mit großen Datenmengen anstelle von fest codierten Regeln zu lernen.

Mit ML können Computer selbst lernen. Diese Art des Lernens nutzt die Rechenleistung moderner Computer, die große Datenmengen problemlos verarbeiten können.

Überwachtes Lernen vs. unbeaufsichtigtes Lernen

Überwachtes Lernen umfasst die Verwendung beschrifteter Datensätze mit Eingaben und erwarteten Ausgaben.

Wenn Sie eine KI mit überwachtem Lernen trainieren, geben Sie ihr eine Eingabe und teilen ihr die erwartete Ausgabe mit.

Wenn die von der KI erzeugte Ausgabe falsch ist, werden die Berechnungen neu angepasst. Dieser Vorgang wird iterativ über den Datensatz ausgeführt, bis die KI keine Fehler mehr macht.

Ein Beispiel für überwachtes Lernen ist eine wettervorhersagende KI. Es lernt, das Wetter anhand historischer Daten vorherzusagen. Diese Trainingsdaten haben Eingaben (Druck, Luftfeuchtigkeit, Windgeschwindigkeit) und Ausgaben (Temperatur).

Unüberwachtes Lernen ist die Aufgabe des maschinellen Lernens unter Verwendung von Datensätzen ohne festgelegte Struktur.

Wenn Sie eine KI mit unbeaufsichtigtem Lernen trainieren, lassen Sie die KI die Daten logisch klassifizieren.

Ein Beispiel für unbeaufsichtigtes Lernen ist eine verhaltensvorhersagende KI für eine E-Commerce-Website. Es wird nicht gelernt, wenn ein beschrifteter Datensatz von Ein- und Ausgängen verwendet wird.

Stattdessen wird eine eigene Klassifizierung der Eingabedaten erstellt. Hier erfahren Sie, welche Art von Benutzern am wahrscheinlichsten unterschiedliche Produkte kaufen.

Wie funktioniert Deep Learning?

Sie sind jetzt bereit zu verstehen, was Deep Learning ist und wie es funktioniert.

Deep Learning ist eine maschinelle Lernmethode . Es ermöglicht uns, eine KI zu trainieren, um Outputs anhand einer Reihe von Inputs vorherzusagen. Sowohl überwachtes als auch unbeaufsichtigtes Lernen kann verwendet werden, um die KI zu trainieren.

Wir werden lernen, wie Deep Learning funktioniert, indem wir einen hypothetischen Preisschätzungsservice für Flugtickets aufbauen . Wir werden es mit einer überwachten Lernmethode trainieren.

Wir möchten, dass unser Preisschätzer für Flugtickets den Preis anhand der folgenden Eingaben vorhersagt (der Einfachheit halber schließen wir Rückflugtickets aus):

  • Origin Flughafen
  • Zielflughafen
  • Abreisedatum
  • Fluggesellschaft

Neuronale Netze

Schauen wir uns das Gehirn unserer KI an.

Wie Tiere hat auch das Gehirn unserer Schätzer-KI Neuronen. Sie werden durch Kreise dargestellt. Diese Neuronen sind miteinander verbunden.

Die Neuronen sind in drei verschiedene Arten von Schichten eingeteilt:

  1. Eingabeebene
  2. Versteckte Ebene (n)
  3. Ausgabeschicht

Die Eingabeebene empfängt Eingabedaten. In unserem Fall haben wir vier Neuronen in der Eingabeebene: Ursprungsflughafen, Zielflughafen, Abflugdatum und Fluggesellschaft. Die Eingabeebene leitet die Eingaben an die erste verborgene Ebene weiter.

Die verborgenen Schichten führen mathematische Berechnungen für unsere Eingaben durch. Eine der Herausforderungen beim Erstellen neuronaler Netze besteht darin, die Anzahl der verborgenen Schichten sowie die Anzahl der Neuronen für jede Schicht zu bestimmen.

Das „ Deep “ in Deep Learning bezieht sich auf mehr als eine verborgene Ebene.

Die Ausgabeebene gibt die Ausgabedaten zurück. In unserem Fall gibt es uns die Preisvorhersage.

Wie berechnet es die Preisvorhersage?

Hier beginnt die Magie des tiefen Lernens .

Jede Verbindung zwischen Neuronen ist mit einem Gewicht verbunden . Dieses Gewicht bestimmt die Wichtigkeit des Eingabewerts. Die Anfangsgewichte werden zufällig eingestellt.

Bei der Vorhersage des Preises eines Flugtickets ist das Abflugdatum einer der wichtigsten Faktoren. Daher werden die Neuronenverbindungen am Abflugdatum ein großes Gewicht haben.

Jedes Neuron hat eine Aktivierungsfunktion. Diese Funktionen sind ohne mathematische Überlegungen schwer zu verstehen.

Einfach ausgedrückt besteht einer seiner Zwecke darin, die Ausgabe des Neurons zu „standardisieren“.

Sobald ein Satz von Eingabedaten alle Schichten des neuronalen Netzwerks durchlaufen hat, gibt er die Ausgabedaten über die Ausgabeschicht zurück.

Nichts kompliziertes, oder?

Training des neuronalen Netzes

Das Training der KI ist der schwierigste Teil des Deep Learning. Warum?

  1. Sie benötigen einen großen Datensatz .
  2. Sie benötigen einen großen Menge an Rechenleistung .

Für unseren Flugpreisschätzer müssen wir historische Daten der Ticketpreise finden. Und aufgrund der großen Anzahl möglicher Kombinationen von Flughäfen und Abflugdaten benötigen wir eine sehr große Liste von Ticketpreisen.

Um die KI zu trainieren, müssen wir ihr die Eingaben aus unserem Datensatz geben und ihre Ausgaben mit den Ausgaben aus dem Datensatz vergleichen. Da die KI noch nicht trainiert ist, sind ihre Ausgaben falsch.

Sobald wir den gesamten Datensatz durchgearbeitet haben, können wir eine Funktion erstellen, die uns zeigt, wie falsch die AI-Ausgaben von den realen Ausgaben waren. Diese Funktion wird als Kostenfunktion bezeichnet.

Idealerweise möchten wir, dass unsere Kostenfunktion Null ist. Dann sind die Ausgänge unserer KI dieselben wie die Ausgänge des Datensatzes.

Wie können wir die Kostenfunktion reduzieren?

Wir ändern die Gewichte zwischen Neuronen. Wir könnten sie zufällig ändern, bis unsere Kostenfunktion niedrig ist, aber das ist nicht sehr effizient.

Stattdessen verwenden wir eine Technik namens Gradient Descent.

Gradient Descent ist eine Technik, mit der wir das Minimum einer Funktion finden können. In unserem Fall suchen wir das Minimum der Kostenfunktion.

Es funktioniert, indem die Gewichte nach jeder Datensatziteration in kleinen Schritten geändert werden . Indem wir die Ableitung (oder den Gradienten) der Kostenfunktion bei einem bestimmten Gewichtssatz berechnen, können wir sehen, in welche Richtung das Minimum ist.

Um die Kostenfunktion zu minimieren, müssen Sie Ihren Datensatz viele Male durchlaufen. Aus diesem Grund benötigen Sie viel Rechenleistung.

Das Aktualisieren der Gewichte mithilfe des Gradientenabstiegs erfolgt automatisch . Das ist die Magie des tiefen Lernens!

Sobald wir unseren Flugpreisschätzer AI geschult haben, können wir ihn verwenden, um zukünftige Preise vorherzusagen.

Wo kann ich mehr lernen?

Es gibt viele andere Arten von neuronalen Netzen: Faltungs-Neuronale Netze für Computer Vision und wiederkehrende Neuronale Netze für die Verarbeitung natürlicher Sprache.

Wenn Sie den technischen Aspekt von Deep Learning erlernen möchten, empfehle ich einen Online-Kurs.

Derzeit ist Andrew Ngs Deep Learning-Spezialisierung einer der besten Kurse für Deep Learning. Wenn Sie nicht an einem Zertifikat interessiert sind, müssen Sie den Kurs nicht bezahlen. Sie können es stattdessen kostenlos prüfen.

Wenn Sie Fragen haben oder weitere technische Erklärungen zu den Konzepten wünschen, wenden Sie sich bitte an uns!

Zusammenfassend…

  • Deep Learning verwendet ein neuronales Netzwerk, um die Intelligenz der Tiere nachzuahmen.
  • Es gibt drei Arten von Schichten von Neuronen in einem neuronalen Netzwerk: die EingabeEbene, versteckte Ebene (n) und Ausgabeebene.
  • Verbindungen zwischen Neuronen sind mit einem Gewicht verbunden, das die Wichtigkeit des Eingabewerts bestimmt.
  • Neuronen wenden eine Aktivierungsfunktion auf die Daten an, um die aus dem Neuron kommende Ausgabe zu „standardisieren“.
  • Um ein neuronales Netzwerk zu trainieren, benötigen Sie einen großen Datensatz.
  • Durch Durchlaufen des Datensatzes und Vergleichen der Ausgaben wird eine Kostenfunktion erstellt, die angibt, um wie viel die KI von den tatsächlichen Ausgaben abweicht.
  • Nach jeder Iteration durch den Datensatz werden die Gewichte zwischen den Neuronen mithilfe des Gradientenabfalls angepasst, um die Kostenfunktion zu reduzieren.

Wenn Ihnen dieser Artikel gefallen hat, geben Sie mir bitte ein paar Klatschen, damit mehr Leute ihn sehen. Vielen Dank!

Sie können auch meine Erfahrungen mit meinem Praktikum bei Shopify überprüfen!

Für weitere Updates folge mir auf Twitter.