Batting

Inhalt

  1. Standardstatistiken
  2. Fortgeschrittene Statistiken
  3. Moderne Statistiken
  4. Bereiche
  5. Korrelationen

Standardstatistiken

Ursprünglich ist man mit einer einzigen Größe ausgekommen, dem Batting Average (AVG oder BA). Es hat mehr als ein Jahrhundert gedauert, bis sich zwei weitere hinzu gesellten, nämlich On Base und Slugging. Weitere Jahrzehnte waren nötig, bis sich OPS zusätzlich im Allgemeingut verankert hatte. Heute haben sich weitere verbesserte fortgeschrittene Stats in den Vordergrund begeben.

 

Batting Average (AVG oder BA)

Bedeutung: Gibt die Anzahl der Basehits pro At Bats an

Formel: H / AB

 

Kritik:

Es sind zweierlei Schwachstellen enthalten. Zum einen werden eben nur Basehits berücksichtigt und nicht Walks (sowie Hit by Pitch), mit denen der Batter ebenfalls ein Aus vermeidet und auf Base gelangt. Zum anderen werden alle Hits gleich behandelt, d.h. ein Single zählt genauso viel wie ein Homerun oder jeder andere Extra-Base-Hit. Mehr zu den Problemen hier ist bei den zu vermeidenden Stats aufgeführt.

 

Die beiden folgenden Größen reparieren jeweils eine dieser Schwachstellen.

 

On Base Percentage (OBP, gelegentlich auch OBA)

Bedeutung: Gibt im wesentlichen die Anzahl der vermiedenen Aus pro Plate Appearance an.

 

Formel: OBA

Kritik: Walks werden nun berücksichtigt, aber immer noch werden alle Hits gleich gewertet.

 

Slugging (SLG)

Bedeutung: Gibt die Anzahl der Total Bases pro At Bats an.

 

Formel: SLG

Kritik: Hier werden zwar die Basehits gewichtet, aber genauere Untersuchungen zeigen, dass die Wichtung nicht exakt genug ist, vor allem aber fehlen hier Walks.

 

Fortgeschrittene Statistiken

Fußend auf Arbeiten von Pionieren wie Pete Palmer und Bill James werden hier einige wenige fortgeschrittene Statistiken vorgestellt. Es liegt in der Natur der Sache, dass es zunehmend kompliziert wird. Zuvor wird noch eine auf den ersten Blick völlig simple Methode erwähnt, die aber dennoch vielfach verwendet wird und durchaus ihren Wert hat:

 

Slash Line

Hier werden einfach die drei elementaren Stats durch einen Schrägstrich (=slash) getrennt angegeben.

 

Beispiele: .(279 / .401 / .419) , (.276 / .402 / .554) und (.312 / .418 / .515)

 

Die erste Zahl gibt den Batting Average, die zweite On Base Percentage, die dritte Slugging. Alle Zahlen geben Karriere-Werte an.

 

Die ersten beiden Batter haben vergleichbare Werte hinschlich der ersten beiden Werte, der zweite Batter sticht den ersten aber deutlich aus bezüglich Slugging. Der dritte ist wohl als reiner Hitter der ausgeglichenste, er weist in allen drei Kategorien überdurchschnittliche Werte auf. Es handelt sich bei den dreien um Rickey Henderson, einen der besten Lead-off Hitter aller Zeiten, Jim Thome und den als einzigen der drei (immer noch) nicht in der Hall of Fame vertretenen Edgar Martinez.

 

On Base Plus Slugging (OPS)

Bedeutung: Hier wird ein einfacher Versuch unternommen, beide Schwachstellen vom AVG gleichzeitig zu entfernen.

 

Formel: OPS = OBP + SLG

 

Kritik: Während OPS sowohl leicht zu berechnen ist als auch sehr gute Ergebnisse für gesamte Teams liefert, ist es zunächst mal lausige Mathematik: Es werden zwei Brüche addiert mit verschiedenem Nenner. Außerdem werden Hits gegenüber Walks überbewertet, da sie in beiden Summanden vorkommen. Mehr dazu kann nach z.B. gelesen werden im Buch von Keith Law (siehe Literaturverzeichnis).

 

Runs Created (RC)

Bedeutung: Die Anzahl der erzeugten Runs soll (zumindest näherungsweise) berechnet werden.

 

Formel: RC = OBP ⋅ TB

 

In einem eigenen Abschnitt wird untersucht, wie gut RC auf Team-Basis die tatsächlich erzielten Runs errechnet, ebenso wird ein Vergleich der Statistiken hinsichtlich Korrelation (siehe Kapitel Einführung) angestellt.

 

Moderne Statistiken

Es liegt in der Natur der Sache, dass es zunehmend kompliziert wird. Sowohl OPS als auch RC existieren in erweiterten Fassungen, die für uns Normalsterbliche mit vertretbarem Aufwand nicht zu berechnen sind.

 

OPS+

Basierend auf OPS erfolgen Anpassungen, die das Heimstadium des Spielers berücksichtigen sowie den Ligadurchschnitt.

Zusätzlich geschieht noch eine sogenannte Normalisierung auf 100. Das dient der besseren Übersicht: OPS+ = 100 entspricht dem Durchschnitt, größere Werte sind besser, kleinere schlechter.

 

Eine entsprechende Anpassung gibt es auch für RC, sie basiert aber auf einer weiteren Größe, die heutzutage für sich genommen größere Bedeutung hat:

 

Weighted On Base Percentage (wOBA)

Bedeutung: Basierend auf On Base Percentage wird zusätzlich berücksichtigt, wie genau ein Batter auf Base gelangt ist. Dabei wird einem Hit eine bestimmte Wertigkeit zugeordnet, die zu einer Gewichtung führt, daher das Weighted.

Etwas ähnliches wird schon bei SLG und in dessen Folge OPS versucht. Jedoch wird es hier ungenau: Ein Double geht mit der Wertigkeit 2 in die Formel ein, ein Single mit einfacher Wertigkeit. Nun ist offensichtlich, dass ein Double mehr Wert besitzt als ein Single. Untersuchungen zeigen aber, dass er nicht doppelt so viel wert ist, sondern etwas weniger. Entsprechendes gilt für Triples und Homeruns. Die Gewichtungsfaktoren schwanken leicht von Saison zu Saison, aber eine brauchbare Formel lautet so:

 

 

Sollte sich jemand für näheres hierzu interessieren, sei auf folgende Quellen hingewiesen:

https://www.fangraphs.com/library/offense/woba/

http://m.mlb.com/glossary/advanced-stats/weighted-on-base-average

 

Weighted Runs Created (wRC)

Wir schenken uns hier die allgemeine Formel und beschreiben stattdessen nur, wie und was berechnet wird.

Ausgehend von der wOBA eines Hitters wird mit dem Liga-Durchschnitt verglichen. Zusätzlich erfolgt eine Skalierung, so dass wieder der Durchschnitt bei 100 liegt. Höhere Werte sind besser, niedrigere schlechter.

 

Brauchbare Quelle:

https://www.fangraphs.com/blogs/wrc-and-wraa/

 

Weighted Runs Created Plus (wRC+)

Hier wird von den RC eines Hitters ausgegangen und verschiedene Anpassungen durchgeführt.

Diese betreffen wieder das Heimstadion und das run environment, also kurz gesagt wie viele Runs im betreffenden Jahr durchschnittlich erzielt wurden. Dies ermöglicht den Vergleich verschiedener Jahre und sogar Epochen. Zusätzlich wird wieder eine Normierung durchgeführt, so dass erneut der Liga-Durchschnitt bei 100 liegt.

 

Brauchbare Quellen:

http://m.mlb.com/glossary/advanced-stats/weighted-runs-created-plus

https://www.fangraphs.com/library/offense/wrc/

 

Batting Average on Balls in Play (BABIP)

Zum Abschluss der Übersicht gibt es noch eine leicht zu berechnende Größe. BABIP wurde ursprünglich im Zusammenhang mit dem Bestreben entwickelt, für Pitcher von der Defensive unabhängige Statistiken zu entwickeln. Es lässt sich aber problemlos und mit Gewinn für Batter anwenden. Bedeutung: Es wird gemessen, wie viele Bälle, die vom Batter ins Spiel gebracht wurden (also alle Fair Balls ohne Homeruns), im Schnitt zu Basehits werden.

 

Formel: BABIP=(H-HR) / (AB-K-HR+SF)

Empfehlungen

Welche Statistiken können nun vor allem empfohlen werden?

Für eine schnelle Übersicht ist die slash-line sicher ganz gut geeignet. Darüber hinaus ist es vor allem Geschmackssache, ob man OPS+, wOBA oder wRC+ verwendet. Alle drei haben sich mittlerweile recht ordentlich durchgesetzt und werden in den Übersichten (Leaderboards) der üblichen Seiten angegeben. Das schöne ist, dass alle drei in der Weise ähnliche Ergebnisse liefern, dass im großen und ganzen die Spitzenreiter bei allen dieselben sind, ebenso die eher schwachen Vertreter der Zunft.

 

Bereiche

Um die Werte einigermaßen einordnen zu können, geben wir hier für die meisten Größen Bereiche an, jeweils für überdurchschnittliche, durchschnittliche und schwächere Resultate. Damit kein Missverständnis auftritt: Es handelt sich ausschließlich um Zahlen aus der MLB, in unseren Ligen sieht es natürlich teils drastisch anders aus.

Alle Werte beziehen sich auf das letzte Jahrzehnt, um halbwegs aktuell zu sein. In früheren Epochen sah das teilweise ganz anders aus. Außerdem sind nur Spieler berücksichtigt mit mindestens 400 AB in einer Saison.

 

Rang AVG OBP SLG OPS RC
Spitzenwerte über 0.350 über 0.420 über 0.600 über 1.000 über 150
sehr gut um 0.300 über 0.360 über 0.470 über 0.850 über 100
Durchschnitt um 0.275 um 0.340 um 0.440 um 0.750 um 80
schwach unter 0.260 unter 0.320 unter 0.410 unter 0.650 um 65
schlecht unter 0.210 unter 0.280 unter 0.320 unter 0.600 unter 50

 

Rang wOBA wRC wRC+
Spitzenwerte über 0.400 105 ab 160
sehr gut über 0.350 90 um 140
Durchschnitt um 0.320 75 um 100
schwach um 0.300 65 um 80
schlecht unter 0.290 60 unter 70

 

Korrelationen

Im Kapitel Einführung wurde der Begriff der Korrelation erklärt. Hier soll das Konzept dazu verwendet werden, einig der Stats miteinander zu vergleichen.

Auf der Grundlage individueller Batter gibt es da Schwierigkeiten, aber auf Team-Basis kommen wir voran. Dazu zunächst einige Vorüberlegungen:

  • Ziel ist es, Spiele zu gewinnen.
  • Hierfür ist es hilfreich, sowohl selbst Runs zu erzielen, als auch gegnerische Runs zu vermeiden.
  • Da wir hier in der Offensiv-Abteilung sind, wenden wir uns dem ersten dieser beiden Aspekte zu, also Runs erzielen.
  • Es werden auf jährlicher Basis je Team die Anzahl der Runs pro Spiel ermittelt, dem werden die gewünschten Statistiken gegenübergestellt, ebenfalls auf Team-Basis.
  • Dann wird jeweils die Korrelation ermittelt.

 

Zur Erinnerung: Die Korrelation ist eine Zahl zwischen -1 und +1. 0 bedeutet keinerlei Korrelation, +1 die stärkste Korrelation, also einen direkten funktionalen Zusammenhang. Negative Werte sind nicht zu erwarten, sie würden bedeuten, dass z.B. ein höherer AVG zu weniger Runs pro Spiel führt.

 

Da wohl eher wenige an der Mathematik dazu interessiert sind, führen wir hier nur Ergebnisse an. Der untersuchte Zeitraum ist 2011 bis 2017.

 

Team-Statistik Korrelaton zu Runs/Spiel
Batting Average 0,707
On Base Percentage 0,844
Slugging 0,908
OPS 0,944
RC 0,946
wOBA 0,941

 

Wir sehen hier, dass Batting Average recht ordentlich korreliert. Das überrascht nicht, denn höherer AVG führt zu mehr Baserunnern und infolgedessen zu mehr Chancen zu scoren.

Aber wir sehen auch, dass alle anderen Stats deutlich besser korrelieren, die letzten drei sind im wesentlichen gleichwertig in dieser Beziehung.

 

Als kleine Einlage zur Abrundung wurden noch Korrelationen zu zwei völlig anderen Größen berechnet: Fielding Percentage (FP) und Strikeouts (SO). Dass FP für sich genommen nicht viel taugt, wurde im Kapitel über zu vermeidende Statistiken erläutert. Zu erwarten wäre ein nicht allzu hoher positiver Wert, positiv deshalb, weil durch weniger Errors auch weniger Runs abgegeben werden sollten.

Ergebnis: Die Korrelation für FP im nämlichen Zeitraum betrug 0,115.

 

Bei Strikeouts wird es interessanter: Hier wäre eine negative Korrelation zu erwarten, da mehr Strikeouts eher hinderlich sind (gemeint sind natürlich die Strikeouts der Batter, nicht die erzielten der Pitcher, welche eher förderlich wären).

Ergebnis: Die Korrelation im betreffenden Zeitraum war −0,055. Das negative Vorzeichen war zu erwarten, aber der Wert in der Nähe von Null überrascht ein wenig. Anscheinend spielen Strikeouts eine deutlich geringere Rolle hinsihtlich Scoren von Runs als gedacht. Bemerkenswert, dass im Zeitraum von 2011 bis 2015 die Korrelation hier -0,276 betrug.

 

Und hier noch zu guter Letzt der angekündigte Vergleich. Es wurden untersucht die Jahre von 2000 bis 2017. Die tatsächlich erzielten Runs wurden je Team verglichen mit den RC je Team.

Es gab eine gewisse Streuung, aber insgesamt eine recht gute Übereinstimmung.Die maximale Abweichung zwischen tatsächlichen Runs und RC war rund 94: Die Cubs erzielten im Jahr 2005 703 Runs bei einem Wert von RC=797. Von Insgesamt 540 Datensätzen lag die Abweichung nur in zwei Fällen über 90 (neben den Cubs noch die Blue Jays 2006), viermal war die Abweichung zwischen 80 und 90 Runs. Demgegenüber betrug die Abweichung 18 mal weniger als 2 Runs.

 

Ein genaueres Bild ergibt die Angabe in Prozenten: Die maximale prozentuale Abweichung war 13,3%, die minimale prozentuale Abweichung 0%. Die mittlere prozentuale Abweichung schließlich ergab 6,7%. Alles in allem eine beeindruckend gute Übereinstimmung, abgesehen von einigen Ausreißern.