Ich habe jeden Intro to Data Science-Kurs im Internet anhand von Tausenden von Datenpunkten bewertet

Vor einem Jahr habe ich eines der besten Informatikprogramme in Kanada abgebrochen. Ich begann mein eigenes Data Science Master-Programm mithilfe von Online-Ressourcen zu erstellen. Ich erkannte, dass ich stattdessen alles, was ich brauchte, durch edX, Coursera und Udacity lernen konnte. Und ich könnte es schneller, effizienter und zu einem Bruchteil der Kosten lernen.

Ich bin jetzt fast fertig. Ich habe viele datenwissenschaftliche Kurse besucht und Teile von vielen anderen geprüft. Ich kenne die Möglichkeiten da draußen und welche Fähigkeiten für Lernende erforderlich sind, die sich auf eine Rolle als Datenanalyst oder Datenwissenschaftler vorbereiten. Vor einigen Monaten habe ich begonnen, einen überprüfungsorientierten Leitfaden zu erstellen, der die besten Kurse für jedes Fach in der Datenwissenschaft empfiehlt.

Für den ersten Leitfaden der Reihe habe ich dem Anfänger-Datenwissenschaftler einige Codierungsklassen empfohlen. Dann waren es Statistiken und Wahrscheinlichkeitsklassen.

Nun zu den Einführungen in die Datenwissenschaft.

(Machen Sie sich keine Sorgen, wenn Sie sich nicht sicher sind, was eine Einführung in den Data Science-Kurs beinhaltet. Ich werde es kurz erklären.)

Für diesen Leitfaden habe ich mehr als 10 Stunden damit verbracht, jedes ab Januar 2017 angebotene Online-Intro zum Data Science-Kurs zu identifizieren, wichtige Informationen aus ihren Lehrplänen und Bewertungen zu extrahieren und ihre Bewertungen zusammenzustellen. Für diese Aufgabe habe ich mich an keine andere als die Open-Source-Community von Class Central und deren Datenbank mit Tausenden von Kursbewertungen und -bewertungen gewandt.

Seit 2011 hat der Gründer von Class Central, Dhawal Shah, Online-Kurse genauer im Auge als wohl jeder andere auf der Welt. Dhawal hat mir persönlich geholfen, diese Ressourcenliste zusammenzustellen.

Wie wir Kurse ausgewählt haben, die berücksichtigt werden sollen

Jeder Kurs muss drei Kriterien erfüllen:

  1. Es muss den datenwissenschaftlichen Prozess lehren. Mehr dazu bald.
  2. Es muss auf Anfrage oder alle paar Monate angeboten werden.
  3. Es muss ein interaktiver Online-Kurs sein, also keine Bücher oder schreibgeschützten Tutorials . Obwohl dies praktikable Lernmethoden sind, konzentriert sich dieser Leitfaden auf Kurse.

Wir glauben, dass wir jeden bemerkenswerten Kurs abgedeckt haben, der die oben genannten Kriterien erfüllt. Da es anscheinend Hunderte von Kursen zu Udemy gibt, haben wir uns entschieden, nur die am besten bewerteten und am besten bewerteten zu berücksichtigen. Es besteht jedoch immer die Möglichkeit, dass wir etwas verpasst haben. Bitte teilen Sie uns im Kommentarbereich mit, ob wir einen guten Kurs ausgelassen haben.

Wie wir Kurse bewertet haben

Wir haben die durchschnittliche Bewertung und die Anzahl der Bewertungen von Class Central und anderen Bewertungsseiten zusammengestellt, um eine gewichtete durchschnittliche Bewertung für jeden Kurs zu berechnen. Wir haben Textrezensionen gelesen und dieses Feedback verwendet, um die numerischen Bewertungen zu ergänzen.

Wir haben subjektive Lehrplanentscheidungen getroffen, die auf zwei Faktoren beruhen:

1. Berichterstattung über den datenwissenschaftlichen Prozess. Überstreicht oder überspringt der Kurs bestimmte Themen? Behandelt es bestimmte Themen zu detailliert? Im nächsten Abschnitt erfahren Sie, was dieser Prozess beinhaltet.

2. Verwendung gängiger datenwissenschaftlicher Tools. Wird der Kurs mit gängigen Programmiersprachen wie Python und / oder R unterrichtet? Diese sind nicht notwendig, aber in den meisten Fällen hilfreich, so dass diese Kurse leicht bevorzugt werden.

Was ist der datenwissenschaftliche Prozess?

Was ist Datenwissenschaft? Was macht ein Datenwissenschaftler? Dies sind die Arten grundlegender Fragen, die ein Kurs zur Einführung in die Datenwissenschaft beantworten sollte. Die folgende Infografik der Harvard-Professoren Joe Blitzstein und Hanspeter Pfister beschreibt einen typischen datenwissenschaftlichen Prozess , der uns bei der Beantwortung dieser Fragen hilft.

Unser Ziel bei dieser Einführung in den Data Science-Kurs ist es, sich mit dem Data Science-Prozess vertraut zu machen. Wir möchten nicht zu ausführlich auf bestimmte Aspekte des Prozesses eingehen, daher der Teil „Intro to“ des Titels.

Für jeden Aspekt werden im idealen Kurs Schlüsselkonzepte im Rahmen des Prozesses erläutert, allgemeine Tools vorgestellt und einige Beispiele (vorzugsweise zum Anfassen) bereitgestellt.

Wir suchen nur eine Einführung. Dieser Leitfaden enthält daher keine vollständigen Spezialisierungen oder Programme wie die Data Science Specialization on Coursera der Johns Hopkins University oder den Data Analyst Nanodegree von Udacity. Diese Zusammenstellungen von Kursen entziehen sich dem Zweck dieser Reihe: die besten Einzelkurse für jedes Fach zu finden, um eine datenwissenschaftliche Ausbildung zu umfassen. Die letzten drei Leitfäden dieser Artikelserie behandeln jeden Aspekt des datenwissenschaftlichen Prozesses im Detail.

Grundlegende Codierung, Statistiken und Wahrscheinlichkeitserfahrung erforderlich

Einige der unten aufgeführten Kurse erfordern grundlegende Programmier-, Statistik- und Wahrscheinlichkeitserfahrung. Diese Anforderung ist verständlich, da die neuen Inhalte einigermaßen fortgeschritten sind und diesen Fächern häufig mehrere Kurse gewidmet sind.

Diese Erfahrung können durch unsere Empfehlungen in den ersten beiden Artikeln (Programmierung, Statistik) in diesem Data Science Career Guide gewonnen werden.

Unsere Wahl für den besten Kurs zur Einführung in die Datenwissenschaft ist…

  • Data Science AZ ™: Inklusive realer Data Science-Übungen (Kirill Eremenko / Udemy)

Kirill Eremenkos Data Science AZ ™ über Udemy ist der klare Gewinner in Bezug auf Breite und Tiefe der Berichterstattung über den Data Science-Prozess der über 20 qualifizierten Kurse. Es hat eine 4,5-Sterne-gewichtete Durchschnittsbewertung über 3.071 Bewertungen, was es zu den am höchsten bewerteten und am meisten bewerteten Kursen der betrachteten Kurse macht.

Es beschreibt den gesamten Prozess und liefert Beispiele aus der Praxis. Mit 21 Stunden Inhalt ist es eine gute Länge. Rezensenten lieben die Bereitstellung des Lehrers und die Organisation des Inhalts. Der Preis variiert je nach häufigen Udemy-Rabatten, sodass Sie den Zugang möglicherweise für nur 10 US-Dollar erwerben können.

Obwohl es nicht unsere „Nutzung von gemeinsamen Daten Science - Tool“ -Box überprüft , das nicht-Python / R Werkzeug Auswahl (gretl, Tableau, Excel) effektiv in Zusammenhang verwendet. Eremenko erwähnt Folgendes, wenn er die Wahl von gretl erklärt (gretl ist ein statistisches Softwarepaket), obwohl es für alle von ihm verwendeten Werkzeuge gilt (Hervorhebung von mir):

In gretl können wir die gleiche Modellierung wie in R und Python durchführen, müssen aber nicht codieren. Das ist die große Sache hier. Einige von Ihnen kennen R vielleicht schon sehr gut, andere wissen es vielleicht gar nicht. Mein Ziel ist es, Ihnen zu zeigen, wie Sie ein robustes Modell erstellen und Ihnen ein Framework geben, das Sie in jedem von Ihnen ausgewählten Tool anwenden können . gretl hilft uns dabei, nicht in unserer Codierung hängen zu bleiben.

Ein prominenter Rezensent bemerkte Folgendes:

Kirill ist der beste Lehrer, den ich online gefunden habe. Er verwendet Beispiele aus dem wirklichen Leben und erklärt häufig auftretende Probleme, damit Sie die Kursarbeit besser verstehen. Er bietet auch viele Einblicke in das, was es bedeutet, ein Datenwissenschaftler zu sein, von der Arbeit mit unzureichenden Daten bis hin zur Präsentation Ihrer Arbeit beim Management der C-Klasse. Ich kann diesen Kurs Anfängern und fortgeschrittenen Datenanalysten nur empfehlen!

Eine großartige Einführung in Python

  • Einführung in die Datenanalyse (Udacity)

Die Einführung von Udacity in die Datenanalyse ist ein relativ neues Angebot, das Teil des beliebten Datenanalysten Nanodegree von Udacity ist. Es behandelt den datenwissenschaftlichen Prozess klar und kohärent mit Python, obwohl es im Modellierungsaspekt ein wenig fehlt. Die geschätzte Zeitspanne beträgt 36 Stunden (sechs Stunden pro Woche über sechs Wochen), obwohl sie meiner Erfahrung nach kürzer ist. Es hat eine 5-Sterne-gewichtete Durchschnittsbewertung über zwei Bewertungen. Es ist frei.

Die Videos sind gut produziert und die Ausbilderin (Caroline Buckey) ist klar und sympathisch. Viele Programmierprüfungen erzwingen die in den Videos erlernten Konzepte. Die Teilnehmer verlassen den Kurs zuversichtlich in ihren neuen und / oder verbesserten NumPy- und Pandas-Fähigkeiten (dies sind beliebte Python-Bibliotheken). Das Abschlussprojekt, das im Nanodegrad bewertet und überprüft wird, jedoch nicht im kostenlosen Einzelkurs, kann eine schöne Ergänzung eines Portfolios sein.

Ein beeindruckendes Angebot ohne Bewertungsdaten

  • Data Science Fundamentals (Big Data University)

Data Science Fundamentals ist eine Vier-Gänge-Reihe, die von der Big Data University von IBM angeboten wird. Es enthält Kurse mit dem Titel Data Science 101, Data Science Methodology, Data Science Hands-on mit Open Source Tools und R 101.

Es deckt den gesamten datenwissenschaftlichen Prozess ab und führt Python, R und verschiedene andere Open-Source-Tools ein. Die Kurse haben einen enormen Produktionswert. Der Aufwand wird auf 13 bis 18 Stunden geschätzt, je nachdem, ob Sie am Ende den Kurs „R 101“ absolvieren, der für den Zweck dieses Handbuchs nicht erforderlich ist. Leider gibt es keine Überprüfungsdaten zu den wichtigsten Überprüfungsseiten, die wir für diese Analyse verwendet haben. Daher können wir sie über die beiden oben genannten Optionen noch nicht empfehlen. Es ist frei.

Der Wettbewerb

Unsere Nummer 1 hatte eine gewichtete durchschnittliche Bewertung von 4,5 von 5 Sternen über 3.068 Bewertungen. Schauen wir uns die anderen Alternativen an, sortiert nach absteigender Bewertung. Im Folgenden finden Sie einige R-Kurse, wenn Sie eine Einführung in diese Sprache erhalten.

  • Python für Data Science und maschinelles Lernen Bootcamp (Jose Portilla / Udemy): Vollständige Prozessabdeckung mit einem werkzeugintensiven Fokus (Python). Weniger prozessgesteuert und eher eine sehr detaillierte Einführung in Python. Erstaunlicher Kurs, obwohl nicht ideal für den Umfang dieses Handbuchs. Es kann, wie Joses R-Kurs unten, sowohl als Intros für Python / R als auch als Intros für Data Science dienen. 21,5 Stunden Inhalt. Es hat eine 4,7- Sterne gewichtete durchschnittliche Bewertung über 1.644 Bewertungen. Die Kosten variieren je nach häufigen Udemy-Rabatten.
  • Bootcamp für Datenwissenschaft und maschinelles Lernen mit R (Jose Portilla / Udemy): Vollständige Prozessabdeckung mit einem werkzeugintensiven Fokus (R). Weniger prozessgesteuert und eher eine sehr detaillierte Einführung in R. Erstaunlicher Kurs, obwohl nicht ideal für den Umfang dieses Handbuchs. Wie der obige Python-Kurs von Jose kann es sowohl als Intros für Python / R als auch als Intros für Data Science verwendet werden. 18 Stunden Inhalt. Es hat eine 4,6- Sterne gewichtete durchschnittliche Bewertung über 847 Bewertungen. Die Kosten variieren je nach häufigen Udemy-Rabatten.
  • Data Science und maschinelles Lernen mit Python - Hands On! (Frank Kane / Udemy): Teilweise Prozessabdeckung. Konzentriert sich auf Statistik und maschinelles Lernen. Anständige Länge (neun Stunden Inhalt). Verwendet Python. Es hat eine 4,5- Sterne gewichtete durchschnittliche Bewertung über 3.104 Bewertungen. Die Kosten variieren je nach häufigen Udemy-Rabatten.
  • Einführung in Data Science (Data Hawk Tech / Udemy): Vollständige Prozessabdeckung, jedoch begrenzte Abdeckungstiefe. Ganz kurz (drei Stunden Inhalt). Behandelt kurz sowohl R als auch Python. Es hat eine 4,4- Sterne gewichtete durchschnittliche Bewertung über 62 Bewertungen. Die Kosten variieren je nach häufigen Udemy-Rabatten.
  • Angewandte Datenwissenschaft: Eine Einführung (Syracuse University / Open Education von Blackboard): Vollständige Prozessabdeckung, wenn auch nicht gleichmäßig verteilt. Konzentriert sich stark auf grundlegende Statistiken und R. Zu angewendet und zu wenig Prozessfokus für den Zweck dieses Handbuchs. Online-Kurserfahrung fühlt sich unzusammenhängend an. Es hat eine 4,33- Sterne gewichtete durchschnittliche Bewertung über 6 Bewertungen. Frei.
  • Einführung in die Datenwissenschaft (Nina Zumel & John Mount / Udemy): Nur teilweise Prozessabdeckung, jedoch gute Tiefe in Bezug auf Datenaufbereitung und Modellierung. Okay Länge (sechs Stunden Inhalt). Verwendet R. Es hat eine 4,3- Sterne gewichtete durchschnittliche Bewertung über 101 Bewertungen. Die Kosten variieren je nach häufigen Udemy-Rabatten.
  • Angewandte Datenwissenschaft mit Python (V2 Maestros / Udemy): Vollständige Prozessabdeckung mit guter Abdeckungstiefe für jeden Aspekt des Prozesses. Anständige Länge (8,5 Stunden Inhalt). Verwendet Python. Es hat eine 4,3- Sterne gewichtete durchschnittliche Bewertung über 92 Bewertungen. Die Kosten variieren je nach häufigen Udemy-Rabatten.
  • Möchten Sie Data Scientist werden? (V2 Maestros / Udemy): Vollständige Prozessabdeckung, jedoch begrenzte Abdeckungstiefe. Ganz kurz (3 Stunden Inhalt). Begrenzte Werkzeugabdeckung. Es hat eine 4,3- Sterne gewichtete durchschnittliche Bewertung über 790 Bewertungen. Die Kosten variieren je nach häufigen Udemy-Rabatten.
  • Data to Insight: Eine Einführung in die Datenanalyse (University of Auckland / FutureLearn): Umfang der Abdeckung unklar. Behauptet, sich auf die Erforschung, Entdeckung und Visualisierung von Daten zu konzentrieren. Wird nicht auf Anfrage angeboten. 24 Stunden Inhalt (drei Stunden pro Woche über acht Wochen). Es hat eine 4- Sterne gewichtete durchschnittliche Bewertung über 2 Bewertungen. Kostenlos mit kostenpflichtigem Zertifikat erhältlich.
  • Data Science Orientation (Microsoft / edX): Teilweise Prozessabdeckung (ohne Modellierungsaspekt). Verwendet Excel, was sinnvoll ist, da es sich um einen Kurs der Marke Microsoft handelt. 12 bis 24 Stunden Inhalt (zwei bis vier Stunden pro Woche über sechs Wochen). Es hat eine 3,95- Sterne gewichtete durchschnittliche Bewertung über 40 Bewertungen. Kostenlos mit verifiziertem Zertifikat für 25 USD erhältlich.
  • Data Science Essentials (Microsoft / edX): Vollständige Prozessabdeckung mit guter Abdeckungstiefe für jeden Aspekt. Deckt R, Python und Azure ML (eine Microsoft-Plattform für maschinelles Lernen) ab. Mehrere 1-Stern-Bewertungen zitieren die Auswahl des Tools (Azure ML) und die schlechte Lieferung des Lehrers. 18 bis 24 Stunden Inhalt (drei bis vier Stunden pro Woche über sechs Wochen). Es hat eine 3,81- Sterne gewichtete durchschnittliche Bewertung über 67 Bewertungen. Kostenlos mit verifiziertem Zertifikat für 49 US-Dollar erhältlich.
  • Angewandte Datenwissenschaft mit R (V2 Maestros / Udemy): Der R-Begleiter zum obigen Python-Kurs von V2 Maestros. Vollständige Prozessabdeckung mit guter Abdeckungstiefe für jeden Aspekt des Prozesses. Anständige Länge (11 Stunden Inhalt). Verwendet R. Es hat eine 3,8- Sterne gewichtete durchschnittliche Bewertung über 212 Bewertungen. Die Kosten variieren je nach häufigen Udemy-Rabatten.
  • Einführung in Data Science (Udacity): Teilweise Prozessabdeckung, jedoch gute Tiefe für die behandelten Themen. Fehlt der Explorationsaspekt, obwohl Udacity einen großartigen, vollständigen Kurs zur explorativen Datenanalyse (EDA) hat. Behauptet, 48 Stunden lang zu sein (sechs Stunden pro Woche über acht Wochen), ist aber meiner Erfahrung nach kürzer. Einige Bewertungen glauben, dass die Einrichtung für den erweiterten Inhalt fehlt. Fühlt sich unorganisiert. Verwendet Python. Es hat eine 3,61- Sterne gewichtete durchschnittliche Bewertung über 18 Bewertungen. Frei.
  • Einführung in Data Science in Python (Universität von Michigan / Coursera): Teilweise Prozessabdeckung. Keine Modellierung und Visualisierung, obwohl die Kurse 2 und 3 in Applied Data Science mit Python-Spezialisierung diese Aspekte abdecken. Die Teilnahme an allen drei Kursen wäre für die Zwecke dieser Leitfäden zu ausführlich. Verwendet Python. Vier Wochen lang. Es hat eine 3,6- Sterne gewichtete durchschnittliche Bewertung über 15 Bewertungen. Kostenlose und kostenpflichtige Optionen verfügbar.
  • Datengesteuerte Entscheidungsfindung (PwC / Coursera): Teilweise Abdeckung (keine Modellierung) mit Geschäftsfokus. Führt viele Tools ein, darunter R, Python, Excel, SAS und Tableau. Vier Wochen lang. Es hat eine 3,5- Sterne gewichtete durchschnittliche Bewertung über 2 Bewertungen. Kostenlose und kostenpflichtige Optionen verfügbar.
  • Ein Crashkurs in Datenwissenschaft (Johns Hopkins University / Coursera): Ein äußerst kurzer Überblick über den gesamten Prozess. Zu kurz für den Zweck dieser Serie. Zwei Stunden lang. Es hat eine 3,4- Sterne gewichtete durchschnittliche Bewertung über 19 Bewertungen. Kostenlose und kostenpflichtige Optionen verfügbar.
  • Die Toolbox des Data Scientist (Johns Hopkins University / Coursera): Ein äußerst kurzer Überblick über den gesamten Prozess. Eher ein Einrichtungskurs für die Data Science Specialization der Johns Hopkins University. Behauptet, 4 bis 16 Stunden Inhalt zu haben (ein bis vier Stunden pro Woche über vier Wochen), obwohl ein Prüfer feststellte, dass der Inhalt in zwei Stunden abgeschlossen sein könnte. Es hat eine 3,22- Sterne gewichtete durchschnittliche Bewertung über 182 Bewertungen. Kostenlose und kostenpflichtige Optionen verfügbar.
  • Datenmanagement und -visualisierung (Wesleyan University / Coursera): Teilweise Prozessabdeckung (keine Modellierung). Vier Wochen lang. Guter Produktionswert. Verwendet Python und SAS. Es hat eine mit 2,67 Sternen gewichtete Durchschnittsbewertung über 6 Bewertungen. Kostenlose und kostenpflichtige Optionen verfügbar.

Die folgenden Kurse hatten ab Januar 2017 keine Bewertungen.

  • CS109 Data Science (Harvard University): Vollständige Prozessabdeckung in großer Tiefe (wahrscheinlich zu ausführlich für den Zweck dieser Serie). Ein voller 12-wöchiger Grundstudiengang. Die Kursnavigation ist schwierig, da der Kurs nicht für den Online-Verbrauch ausgelegt ist. Aktuelle Harvard-Vorträge werden gefilmt. Die obige Infografik zum datenwissenschaftlichen Prozess stammt aus diesem Kurs. Verwendet Python. Keine Überprüfungsdaten. Frei.
  • Einführung in Data Analytics for Business (Universität von Colorado, Boulder / Coursera): Teilweise Prozessabdeckung (ohne Modellierungs- und Visualisierungsaspekte) mit Schwerpunkt auf Business. Der datenwissenschaftliche Prozess wird in ihren Vorlesungen als „Information-Action Value Chain“ getarnt. Vier Wochen lang. Beschreibt mehrere Tools, deckt jedoch nur SQL in einer beliebigen Tiefe ab. Keine Überprüfungsdaten. Kostenlose und kostenpflichtige Optionen verfügbar.
  • Einführung in Data Science (Lynda): Vollständige Prozessabdeckung, jedoch begrenzte Abdeckungstiefe. Ganz kurz (drei Stunden Inhalt). Führt sowohl R als auch Python ein. Keine Überprüfungsdaten. Die Kosten hängen vom Lynda-Abonnement ab.

Verpacken

Dies ist der dritte Teil einer sechsteiligen Reihe, in der die besten Online-Kurse für den Einstieg in die Datenwissenschaft behandelt werden. Wir haben die Programmierung im ersten Artikel und die Statistik und Wahrscheinlichkeit im zweiten Artikel behandelt. Der Rest der Reihe wird andere datenwissenschaftliche Kernkompetenzen abdecken: Datenvisualisierung und maschinelles Lernen.

Wenn Sie Data Science lernen möchten, beginnen Sie mit einer dieser Programmierklassen

Wenn Sie Data Science lernen möchten, nehmen Sie an einigen dieser Statistikklassen teil

Das letzte Stück wird eine Zusammenfassung dieser Artikel sowie die besten Online-Kurse für andere Schlüsselthemen wie Daten-Wrangling, Datenbanken und sogar Software-Engineering sein.

Wenn Sie nach einer vollständigen Liste der Online-Kurse von Data Science suchen, finden Sie diese auf der Themenseite Data Science und Big Data von Class Central.

Wenn Sie dies gerne gelesen haben, sehen Sie sich einige der anderen Stücke von Class Central an:

Hier sind 250 Ivy League-Kurse, die Sie jetzt kostenlos online belegen können

250 MOOCs aus Brown, Columbia, Cornell, Dartmouth, Harvard, Penn, Princeton und Yale.

Die 50 besten kostenlosen Online-Universitätskurse nach Daten

Als ich Class Central im November 2011 startete, gab es ungefähr 18 kostenlose Online-Kurse und fast alle…

Wenn Sie Vorschläge für Kurse haben, die ich verpasst habe, lassen Sie es mich in den Antworten wissen!

Wenn Sie dies hilfreich fanden, klicken Sie auf? so werden mehr Leute es hier auf Medium sehen.

Dies ist eine komprimierte Version meines Originalartikels, der in Class Central veröffentlicht wurde und weitere Kursbeschreibungen, Lehrpläne und mehrere Rezensionen enthält.