Weka Tutorial - GUI-basiertes maschinelles Lernen mit Java

Heutzutage gehören Programmiersprachen wie Python und R zweifellos zu den gefragtesten Sprachen in den Bereichen Data Science und Machine Learning.

Aber ist es auch möglich, allgemeine Aufgaben des maschinellen Lernens und der Datenwissenschaft auszuführen, ohne unbedingt die Codierung zu beherrschen?

Natürlich ist es das! Weka ist ein Open Source-Paket auf Basis der grafischen Benutzeroberfläche. Es kann verwendet werden, um allgemeine Data Science-Aufgaben nur über die grafische Oberfläche auszuführen.

Grundlagen

Weka kann einfach auf jeder Art von Plattform installiert werden, indem Sie den Anweisungen unter dem folgenden Link folgen. Die einzige Voraussetzung ist die Installation von Java 8.0 auf Ihrem lokalen Computer.

Sobald Sie Weka installiert haben, verfügen Sie über eine Reihe von Standarddatenverarbeitungs- und Inferenztechniken wie:

  • Datenvorverarbeitung : Sobald Sie ein Dataset geladen haben, können Sie mit Weka dessen Attribute und Instanzen schnell untersuchen. Darüber hinaus stehen verschiedene Filtertechniken zur Verfügung, um beispielsweise kategoriale Daten in numerische Daten umzuwandeln oder eine Merkmalsauswahl durchzuführen, um die Dimensionalität unseres Datensatzes zu verringern (z. B. um Trainingszeiten und Leistung zu beschleunigen).
  • Klassifizierungs- und Regressionsalgorithmen:Eine Sammlung verschiedener Algorithmen wie Gaußsche Naive Bayes, Entscheidungsbäume, K-Nearest Neighbor, Ensembles-Techniken und verschiedene lineare Regressionsvarianten.
  • Clustering: Diese Technik kann verwendet werden, um die Hauptkategorien in unseren Daten unbeaufsichtigt zu identifizieren. Einige in der Weka-Sammlung verfügbare Beispielalgorithmen sind K-Means Clustering und Expectation Maximization.
  • Erkennen von Assoziationen: Erkennen von Regeln in unserem Datensatz, um Muster und Verbindungen zwischen den verschiedenen Funktionen leichter identifizieren zu können.
  • Datenvisualisierung:Eine Reihe integrierter Datenvisualisierungstechniken zur schnellen Visualisierung von Korrelationen zwischen Features und zur Darstellung erlernter maschineller Lernmuster wie Entscheidungsbäume und K-Means-Clustering.

Ein weiteres interessantes Merkmal von Weka ist die Möglichkeit, neue Pakete beim Erstellen zu installieren.

Ein Beispiel für ein zusätzliches Paket, das Sie installieren können, ist AutoML. AutoML kann in der Tat besonders für Anfänger nützlich sein, die möglicherweise Schwierigkeiten haben, herauszufinden, welches Modell für maschinelles Lernen für eine bestimmte Aufgabe am besten geeignet ist.

Mit dem Weka AutoML-Paket können Sie verschiedene Modelle des maschinellen Lernens problemlos im laufenden Betrieb testen. Außerdem können Sie die Hyperparameter automatisch anpassen, um die Leistung zu steigern.

Schließlich bietet Weka für erfahrene Benutzer auch eine Befehlszeilenschnittstelle zur Verwendung von Java-Code. Dies kann besonders nützlich sein, wenn Sie mit großen Datenmengen arbeiten.

Beispiel

Wir werden nun ein einfaches Beispiel durchgehen, um zu demonstrieren, wie man mit Weka anfängt.

Zunächst können wir unsere Analyse starten, indem wir den Weka Explorer öffnen und unseren Datensatz öffnen (in diesem Beispiel den Iris-Datensatz).

Wählen Sie die Registerkarte Klassifizieren, wählen Sie Naive Bayes als unseren Klassifikator und klicken Sie auf Start. Sie werden sehen, dass wir schnell eine Klassifizierungsgenauigkeit von 96% erreichen können, ohne Code schreiben zu müssen!

Fazit

Wenn Sie weitere Informationen zu den ersten Schritten mit Weka suchen, ist diese YouTube-Serie von Google Developers ein guter Ausgangspunkt.

Kontaktiere mich

Wenn Sie über meine neuesten Artikel und Projekte auf dem Laufenden bleiben möchten, folgen Sie mir auf Medium und abonnieren Sie meine Mailingliste. Dies sind einige meiner Kontaktdaten:

  • Linkedin
  • Persönlicher Blog
  • Persönliche Webseite
  • Mittleres Profil
  • GitHub
  • Kaggle

Titelbild aus diesem Artikel.