Datentypen in der Statistik - Nominal-, Ordinal-, Intervall- und Verhältnisdatentypen, die anhand von Beispielen erläutert werden

Wenn Sie für eine Statistikprüfung studieren und Ihre Datentypen überprüfen müssen, gibt Ihnen dieser Artikel einen kurzen Überblick mit einigen einfachen Beispielen.

Denn seien wir ehrlich: Nicht viele Menschen studieren Datentypen zum Spaß oder in ihrem wirklichen Alltag.

Also lasst uns eintauchen.

Quantitative und qualitative Daten - was ist der Unterschied?

Kurz gesagt: Quantitativ bedeutet, dass Sie es zählen können und es numerisch ist (denken Sie an Quantität - etwas, das Sie zählen können). Qualitativ bedeutet, dass dies nicht möglich ist und nicht numerisch (denken Sie stattdessen an Qualität - kategoriale Daten).

Boom! Einfach, richtig?

Es gibt noch eine Unterscheidung, die wir treffen sollten, bevor wir zu den tatsächlichen Datentypen übergehen, und sie hat mit quantitativen (Zahlen-) Daten zu tun: diskrete vs. kontinuierliche Daten.

Bei diskreten Daten handelt es sich um ganze Zahlen (ganze Zahlen - wie 1, 356 oder 9), die nicht nach der Art ihrer Darstellung unterteilt werden können.

Wie die Anzahl der Personen in einer Klasse, die Anzahl der Finger an Ihren Händen oder die Anzahl der Kinder, die jemand hat. Sie können nicht 1,9 Kinder in einer Familie haben (trotz der Aussagen der Volkszählung).

Kontinuierliche Daten sind dagegen das Gegenteil. Es kann beliebig aufgeteilt und auf viele Dezimalstellen gemessen werden.

Wie das Gewicht eines Autos (kann mit vielen Dezimalstellen berechnet werden), die Temperatur (32,543 Grad usw.) oder die Geschwindigkeit eines Flugzeugs.

Nun zu den lustigen Sachen.

Qualitative Datentypen

Nenndaten

Nominaldaten werden verwendet, um Variablen ohne quantitativen Wert zu kennzeichnen. Häufige Beispiele sind Männer / Frauen (wenn auch etwas veraltet), Haarfarbe, Nationalitäten, Namen von Personen und so weiter.

Im Klartext: Im Grunde handelt es sich um Labels (und nominal kommt von "name", damit Sie sich besser erinnern können). Sie haben braune Haare (oder braune Augen) . Du bist Amerikaner . Du heißt Jane .

Beispiele:

Welche Haarfarbe hast du?

  • Braun
  • Blond
  • Schwarz
  • Regenbogen-Einhorn

Was ist deine Nationalität?

  • amerikanisch
  • Deutsche
  • Kenianer
  • japanisch

Beachten Sie, dass sich diese Variablen nicht überlappen. Für statistische Zwecke können Sie ohnehin nicht sowohl braunes als auch regenbogenfarbenes Einhornhaar haben. Und sie sind nur durch die Hauptkategorie wirklich verwandt, zu der sie gehören.

Ordnungsdaten

Der Schlüssel zu Ordnungsdaten besteht darin, sich daran zu erinnern, dass Ordnungszahlen wie Reihenfolge klingen - und es ist die Reihenfolge der Variablen, die zählt. Nicht so sehr die Unterschiede zwischen diesen Werten.

Ordnungsskalen werden häufig für Messungen der Zufriedenheit, des Glücks usw. verwendet. Haben Sie jemals an einer dieser Umfragen teilgenommen?

"Wie wahrscheinlich ist es, dass Sie unseren Freunden unsere Dienste empfehlen?"

  • Sehr wahrscheinlich
  • Wahrscheinlich
  • Neutral
  • Unwahrscheinlich
  • Sehr unwahrscheinlich

Sehen Sie, wir wissen nicht wirklich, was der Unterschied zwischen sehr unwahrscheinlich und unwahrscheinlich ist - oder ob es die gleiche Wahrscheinlichkeit (oder Unwahrscheinlichkeit) ist wie zwischen wahrscheinlich und sehr wahrscheinlich. Aber das ist in Ordnung. Wir wissen nur, dass wahrscheinlich mehr als neutral und unwahrscheinlich mehr als sehr unwahrscheinlich ist. Es ist alles in der Reihenfolge.

Quantitative Datentypen

Intervalldaten

Intervalldaten machen Spaß (und sind nützlich), da sie sowohl die Reihenfolge als auch den Unterschied zwischen Ihren Variablen betreffen . Auf diese Weise können Sie die Standardabweichung und die zentrale Tendenz messen.

Das beliebteste Beispiel für Intervalldaten sind Temperaturen in Grad Celsius. 20 Grad Celsius sind wärmer als 10 und der Unterschied zwischen 20 Grad und 10 Grad beträgt 10 Grad. Der Unterschied zwischen 10 und 0 beträgt ebenfalls 10 Grad.

Wenn Sie Hilfe benötigen, um sich daran zu erinnern, was Intervallskalen sind, denken Sie einfach an die Bedeutung des Intervalls: den Abstand dazwischen . Sie interessieren sich also nicht nur für die Reihenfolge der Variablen, sondern auch für die Werte dazwischen.

Es gibt jedoch ein kleines Problem mit Intervallen: Es gibt keine "wahre Null". Eine wahre Null hat keinen Wert - es gibt nichts davon - aber 0 Grad C hat definitiv einen Wert: Es ist ziemlich kalt. Sie können auch negative Zahlen haben.

Wenn Sie keine echte Null haben, können Sie keine Verhältnisse berechnen. Dies bedeutet Additions- und Subtraktionsarbeit, Division und Multiplikation jedoch nicht.

Verhältnisdaten

Gott sei Dank gibt es Verhältnisdaten. Es löst alle unsere Probleme.

Verhältnisdaten geben Auskunft über die Reihenfolge der Variablen, die Unterschiede zwischen ihnen und sie haben diesen absoluten Nullpunkt. Dadurch können alle Arten von Berechnungen und Schlussfolgerungen durchgeführt und gezeichnet werden.

Verhältnisdaten sind sehr ähnliche Intervalldaten, außer dass Null keine bedeutet. Für Verhältnisdaten ist es nicht möglich, negative Werte zu haben.

Zum Beispiel ist Höhe Verhältnisdaten. Es ist nicht möglich, eine negative Höhe zu haben. Wenn die Höhe eines Objekts Null ist, gibt es kein Objekt. Das ist anders als so etwas wie Temperatur. Sowohl 0 Grad als auch -5 Grad sind vollständig gültige und aussagekräftige Temperaturen.

Jetzt, da Sie einen grundlegenden Überblick über diese Datentypen haben, sollten Sie etwas besser bereit sein, diese Statistikprüfung in Angriff zu nehmen.