So berechnen Sie den Durchschnitt einer Liste - Statistik und Pythons mittlere Funktion werden ausführlich erläutert

Mathematik und Programmierung gehen Hand in Hand. Wenn Sie ein Programmierer sind, müssen Sie irgendwann Mathematik verwenden.

Datenwissenschaft, maschinelles Lernen, künstliche Intelligenz und Kryptowährungen basieren auf komplexen mathematischen Prinzipien.

Die Verwendung von mathematischen Funktionen muss jedoch nicht komplex sein! Python abstrahiert alles weg. Sobald Sie die Konzepte verstanden haben, müssen Sie nicht mehr alle Details der Implementierung verstehen.

Mathe muss nicht beängstigend sein

Es gibt viele mathematische Funktionen, auf die Sie stoßen werden. Wenn Sie mit Daten oder Analysen arbeiten, ist es wichtig, dass Sie einige mathematische Prinzipien und Funktionen verstehen.

Eine solche Funktion, die Sie verstehen müssen, ist die meanFunktion.

Lassen Sie sich nicht vom Namen abschrecken - die meanFunktion in Python ist nicht gemein (Wortspiel beabsichtigt) .

Dieser Beitrag ist in sich geschlossen, aber ich gehe davon aus, dass Sie Erfahrung mit Python haben und wissen, was eine Python-Liste ist. Wenn nicht, lesen Sie diesen Artikel, bevor Sie fortfahren.

Wenn Sie fertig sind, kommen Sie zurück und tauchen Sie mit mir tief in die meanFunktion ein.

Statistiken

Sie möchten also mehr über die meanFunktion erfahren . Das ist großartig! Bevor wir uns diese Funktion ansehen, ist es wichtig, die Disziplin zu betrachten, aus der sie stammt: die Statistik.

Im Bild oben sehen wir eine Grafik. Ein Diagramm ist eine bildliche Darstellung, die die Beziehung einer Variablen zu einer anderen zeigt.

Diagramme sind nützlich, weil sie es uns ermöglichen, Daten so zu organisieren, dass wir Trends und Beziehungen zwischen den Daten schnell erkennen können. Ein Diagramm ist nur ein Werkzeug, mit dem wir Daten visualisieren und analysieren können.

Statistik ist ein Zweig der Mathematik, der es uns ermöglicht, Daten systematisch zu klassifizieren, zu analysieren und zu interpretieren. Dies ist wichtig, da wir mit Statistiken eine Sammlung vorgefertigter Tools haben, um all diese Dinge zu tun.

Stellen Sie sich vor, Sie müssten eine Säge jedes Mal neu erfinden, wenn Sie ein Stück Holz schneiden müssten. Wir würden viele Leute Sägen mit unterschiedlichen Namen nennen, obwohl sie dasselbe tun. Um dieses Problem zu vermeiden, haben wir der Säge einen Namen gegeben, auf den sich jeder beziehen kann.

Das gleiche passiert in der Statistik - wir haben Tools, mit denen jeder vertraut ist. Ein solches Werkzeug ist der Mittelwert.

Modus, Median und Mittelwert

Obwohl der Mittelwert durchaus in der Lage ist, für sich selbst zu stehen, wird er normalerweise als Teil eines Trios unterrichtet, das den Modus, den Median und den Mittelwert umfasst.

Schauen wir uns eine Gruppe von Zahlen an, damit Sie verstehen, was hier passiert. Stellen Sie sich vor, Sie haben die folgenden Zahlen:

1, 2, 3, 3, 4, 6, 9

Angenommen, wir wollten ausdrücken, welche Nummer am häufigsten vorkommt. Es wäre 3, und der Name, den wir dieser Eigenschaft geben, ist mode. Der Modus ist die Nummer, die in einem von uns untersuchten Satz am häufigsten vorkommt.

Die Zahl in der Mitte eines geordneten Satzes wird als Median bezeichnet. Um den Median einer numerischen Menge zu ermitteln, ordnen Sie die Zahlen vom kleinsten zum größten an und sehen Sie sich dann die Zahl in der Mitte an. Der obige Satz von Zahlen ist bereits vom kleinsten zum größten angeordnet, daher beträgt die mittlere Zahl ebenfalls 3.

Schließlich ist der Mittelwert eine andere Möglichkeit, sich auf den Durchschnitt der Menge zu beziehen. Um den Mittelwert zu ermitteln, addieren Sie einfach alle Zahlen und dividieren Sie ihn durch die Gesamtzahl der Elemente in der Menge. Bei den obigen Zahlen erhalten wir 28, wenn wir alle addieren. Die Gesamtzahl der Elemente im Satz beträgt 7, unser Mittelwert also 4.

Warum brauchen wir den Mittelwert?

An diesem Punkt fragen Sie sich vielleicht, warum wir den Mittelwert einer Zahl überhaupt finden müssen.

Die Sache ist, sogar die Statistik selbst ist in mehrere Gruppen unterteilt. So wie Sie Werkzeuge haben, die für die Arbeit mit Holz und andere für die Arbeit mit Metall verwendet werden, werden einige Werkzeuge in der Statistik in Klassen eingeteilt, da sie für einen ähnlichen Zweck verwendet werden.

Eine solche Gruppe in der Statistik wird als zusammenfassende Statistik bezeichnet. Statistiken werden unter anderem zur Beschreibung von Daten verwendet, und zusammenfassende Statistiken sind eine Sammlung von Tools, die für diesen Zweck verwendet werden. Eines der Elemente in dieser Werkzeugklasse ist der Mittelwert.

Der Mittelwert ist wichtig, da er uns bei der Analyse der sogenannten Verteilung hilft. In der Statistik ist eine Verteilung eine Methode, mit der wir eine Variable betrachten, zu der wir Informationen benötigen. Anhand einer Verteilung werden die Werte dieser Variablen und ihre Häufigkeit untersucht.

Wenn wir Daten sammeln, sehen wir häufig die Normalverteilung in Form der Glockenkurve:

Das heißt, die Variable hat einen gemeinsamen Wert, zu dem sie tendiert, sowie einen Start- und einen Endpunkt.

Der Mittelwert bedeutet, dass wir eine solche Verteilung nehmen und die zentrale Tendenz der Variablen betrachten können, an der sich die Werte der Variablen tendenziell zusammenballen.

Wir können also sagen, dass der Mittelwert die zentrale Tendenz der Verteilung beschreibt.

Berechnung des Mittelwerts in Python

Wir können den Mittelwert manuell berechnen, wenn wir einen kleinen numerischen Datensatz haben, mit dem wir einige Werte arbeiten müssen. Wenn wir jedoch Hunderte oder Tausende von Werten in einem Datensatz haben, ist es unmöglich, diese von Hand zu berechnen.

Da Python eine "Batterien enthalten" -Sprache ist, können wir dies tun, indem wir die meanFunktion des Statistikmoduls in Python verwenden.

Verwenden wir die meanFunktion, um den Mittelwert des numerischen Datensatzes zu berechnen, den wir zuvor im Beitrag hatten:

 # 1. import the statistics module import statistics # 2. list containing our numerical data set numerical_data_set = [1, 2, 3, 3, 4, 6, 9] # 3. calculate the mean calc_mean = statistics.mean(numerical_data_set) # 4. print our calculated mean print("Mean is: ", calc_mean) 

Our code consists of a 4 step sequence that we can use to calculate the mean:

  1. We import the statistics module that contains our mean function
  2. We create a Python list containing the numerical data set of which we would like to calculate the mean
  3. We calculate the mean and store the result in a variable, calc_mean
  4. We output our calculated mean so that we can get visual feedback

When we run the code, we will get the following output:

The program outputs the same value as our manual calculations. When we are working with large data sets, this function will be able to scale to handle whatever we can throw at it.

Wrapping Up

In this post we looked at the mean function in Python. We began by discussing statistics as a whole, then took a deep dive into mean.

Now that you have a solid understanding of statistics and the mean function in Python, you can use it in your own programs.

If you liked this article, then you may also be curious about learning about data structures and algorithms. If you want a simple, clear, step by step guide to learning about data structures and algorithms without having to write a single line of code, then you can check out the book Codeless Data Structures and Algorithms.

Read the book here:

Codelose Datenstrukturen und Algorithmen - Lernen Sie DSA, ohne eine einzige Codezeile zu schreiben Armstrong Subero | Apress Dieses Buch bietet Ihnen eine neue Perspektive auf Algorithmen und Datenstrukturen, die völlig codefrei sind. Erfahren Sie mehr über Datenstrukturalgorithmen (DSAs), ohne jemals Ihren Code-Editor öffnen, einen Compiler verwenden oder eine integrierte Entwicklungsumgebung (IDE) betrachten zu müssen. Armstrong Subero Suchmenü Warenkorb V Ihr Warenkorb ist derzeit leer. Login AccountBookshelf Login Apress Access