Sie benötigen diese Spickzettel, wenn Sie sich mit Algorithmen für maschinelles Lernen befassen.

Als ich vor zwei Jahren anfing, maschinelles Lernen (ML) zu lernen, hatte ich viele Fragen, welche Algorithmen verwendet werden sollten, wie sie mit Datensätzen korreliert werden können usw. Die Antwort hing von vielen Faktoren ab, wie der Datengröße, der erwarteten Ausgabe und den verfügbaren Berechnungen Ressourcen. Ich wurde dann in die ML-Spickzettel eingeführt, die mich mit den häufig verwendeten Algorithmen, Paketen und Funktionen vertraut machten.

Dieser Beitrag enthält die drei wichtigsten Spickzettel, die ich einem Anfänger empfehlen würde, der daran interessiert ist, ML-Algorithmen zu identifizieren und auf verschiedene Probleme anzuwenden. Angesichts der Geschwindigkeit, mit der sich diese Domäne entwickelt, entwickeln sich auch die Trendalgorithmen weiter. Daher ist es wichtig, die Algorithmen zu verstehen, die dazu beitragen, die Bereiche überwachtes und unbeaufsichtigtes Lernen, Klassifizierung und Regression usw. zu berücksichtigen.

Flussdiagramm des SAS-Algorithmus

Quelle: //blogs.sas.com/content/subconsciousmusings/2017/04/12/machine-learning-algorithm-use/

Der SAS-Blog selbst ist eine großartige Lektüre. Der Link zeigt die Verwendung des Spickzettel sowie Überlegungen bei der Auswahl eines Algorithmus. Der Spickzettel zeigt ein einfach zu verwendendes Flussdiagramm, das Daten mit den Algorithmen korreliert.

Python und Scikit Spickzettel

Die meisten Entwickler arbeiten in Python oder R, um die ML-Algorithmen zu implementieren. Ich arbeite in Python und daher waren die folgenden zwei Spickzettel für mich sehr nützlich.

Quelle: //s3.amazonaws.com/assets.datacamp.com/blog_assets/PythonForDataScience.pdf

Das Python-Spickzettel wurde von DataCamp erstellt und kann als Kurzreferenz für die Anleitung durch ML Python-Pakete und Datenstrukturen verwendet werden.

Quelle: //s3.amazonaws.com/assets.datacamp.com/blog_assets/Scikit_Learn_Cheat_Sheet_Python.pdf

Scikit-learn ist eine Open-Source-Python-Bibliothek, die eine Vielzahl von ML, Vorverarbeitung von Daten und Kreuzvalidierung sowie Visualisierung von Algorithmen implementiert. Diese Bibliothek ist ein Muss für jeden angehenden Datenwissenschaftler, daher empfehle ich diesen Spickzettel.

Benutzerfreundliche Karte für maschinelles Lernen

Quelle: //scikit-learn.org/stable/tutorial/machine_learning_map/

Dieser Spickzettel ist in den Scikit-Lernprogrammen verfügbar und eines der am einfachsten zu verstehenden und zu verwendenden Flussdiagramme. Unter dem obigen Link haben Sie den vollständigen Ablauf zum Lösen eines ML-Problems. Sie können auch auf einen beliebigen Algorithmus auf der Karte klicken, um dessen Implementierung zu verstehen.

Teilen & Lernen! Fügen Sie Ihren Lieblings-Spickzettel in den Kommentaren unten hinzu.