Antimagnets Statistik-Ecke

JimmyBond

Ehrenmitglied
Registriert
7. Mai 2003
Beiträge
4.057
ok ist grammatisch nicht unbedingt korrekt, allerdings weis jeder bescheid was gemeint ist, wenn mans ueber funk hoert... seh darin also keine probleme :wink:
 

Trasher

Forenlegende
Registriert
10. April 2002
Beiträge
5.842
Mr. Wikipedia sagt zum Thema "Evakuierung":

"Die Verwendung für Personen und Tiere ist fragwürdig und wird in entsprechenden Wörterbüchern ebenfalls so deklariert (Duden – Großes Wörterbuch der Deutschen Sprache), weshalb von einer solchen Benutzung abzuraten ist.
Die Verwendung als „Evakuierung von Menschen“ ist in der Presse nicht unüblich."
 

antimagnet

Forenlegende
Registriert
10. April 2002
Beiträge
9.676
ja, call me a korinthenkacker, aber evakuieren heißt vom wortsinn her ausleeren oder besser entleeren, und entleert werden die gebäude oder die gegenden, aber nicht die menschen.


nuja, ich seh schon, ich sollt mich besser den statistiken widmen...

:D
 

holo

Ehrenmitglied
Registriert
27. August 2005
Beiträge
3.858
Nee, lass´ mal, es lohnt sich, über solche Kleinigkeiten im Leben nachzudenken. Wie oft sehen wir über Dinge hinweg, ohne sie im Detail zu würdigen?

Evakuierung ist da ein prima Beispiel.

Gruß
Holo
 

antimagnet

Forenlegende
Registriert
10. April 2002
Beiträge
9.676
danke für den link.

ich hab zwar keine ahnung, wie bild die wahrscheinlichkeiten ausgerechnet hat, fürchte aber, dass bildblog in seiner interpretation ebenfalls ganz schön danebengelangt hat:

Damit hat "Bild" insgesamt Wahrscheinlichkeiten in Höhe von 726 Prozent verteilt. Mit anderen Worten: Die "Bild"-Analyse hat ergeben, dass am Ende der Saison nicht weniger als sieben Bundesliga-Vereine in die zweite Liga absteigen müssen, und ein trauriger achter nur zu knappen Dreivierteln erstklassig bleibt.

uiuiui. ich glaub nicht, dass das so geht.

mal ganz unfußballerisch gedacht:

3 von 18 vereinen steigen ab. gehen wir davon aus, dass einzig der zufall entscheidet, wer gewinnt, so gibt es zu beginn der saison für jeden verein die chance von 1/6, zu den absteigern zu gehören. äh... macht insgesamt 18*1/6=3. macht 300%... öh... vielleicht hat bildblog doch nicht danebengelangt. hei, ist das kompliziert, mit der wahrscheinlichkeitsrechnung. wer mitdenken möchte, ist herzlich eingeladen, sich zu äußern...

8)
 

Mother_Shabubu

Ehrenmitglied
Registriert
3. Juli 2003
Beiträge
2.237
Ist doch ganz einfach: Sieben Vereine bekommen nächstes Jahr keine Lizenz und werden daher zwangsabgestiegen Die überschüssigen 26% entfallen auf Bielefeld, welches bekanntlich nicht existiert. 8)

Etwas ernsthafter: Ich vermute, daß hier subjektive Einschätzungen vorliegen. Mögliche Lösung: Es gab eine Umfrage in der Bild-Redaktion, die Plätze 11 bis 18 in der Abschlußtabelle zu tippen und es hat nicht jeder alle 8 Stimmen abgegeben, so daß weder Bild noch Bildblog auf 800% kamen.

Kleines Beispiel: 4 Leute stimmen ab, jeder hat 3 Stimmen und jeder Verein kann maximal 1-mal genannt werden:

Code:
            18 17 16
Tip des 1.: MG MZ AC
Tip des 2.: MG MZ F
Tip des 3.: MG AC F
Tip des 4.: MG MZ

100% der Teilnehmer stimmen für MG auf einem Abstiegsplatz, 75% für MZ und je 50% für AC und F, das wären nach Bildblog-Rechnung 275%.
Wenn man aber weiß, auf welchen Platz genau die Vereine getippt wurden, sieht die Sache anders aus: Dann wird Platz 18 zu 100% von MG belegt, Platz 17 zu 75% von MZ und zu 25% von AC und Platz 16 zu 50% von F, zu 25% von AC und zu 25% von einem anderen Verein. Mit Wahrscheinlichkeit 100% landet also auf Platz 18 irgendein Verein, auf Platz 17 kommt mit W'keit 100% ein weiterer und auf Platz 16 mit W'keit 100% ein dritter. Gleichzeitig hat jeder Verein eine Wahrscheinlichkeit von maximal 100% abzusteigen. Mehr können es nicht sein, da jeder Verein maximal 1-mal genannt werden kann, aber weniger, da er nicht genannt werden muß. Insgesamt komme ich also wie Anti und der Bildblog auf 300%, wobei kein Verein und kein Platz mehr als 100% haben kann.

Bei genauerer Betrachtung lässt sich mein Beispiel aber nicht auf die Zahlen von Bild anwenden, da man selbst dort nicht so dumm sein dürfte, acht Absteiger zu tippen. Vergesst also am besten alles, was ich geschrieben habe und stellt euch vor, daß der Autor mit den Zahlen ausdrücken wollte, wieviel er auf den Klassenerhalt eines Vereins (oder den Abstieg, es muß nur konsequent sein) setzen würde, wenn er für seinen Einsatz einen angemessenen Betrag erwarten könnte. Allerdings weiß ich nicht, ob sich die Wahrscheinlichkeiten nicht auch zu 300% addieren müssen (oder zu 100%, wenn ich die Absteigerkombinationen tippen würde), da ich mich mit der Wahrscheinlichkeit im Sinne von Bayes auch nicht so auskenne.
Auf diesem Weg kann ich die Zahlen von Bild also auch nicht erklären, denn würde ich einen bestimmten Einsatz auf alle möglichen Kombinationen von Absteigern verwetten, so sollte ich eigentlich genau meinen Einsatz wiederbekommen, da ich bei den einen was verliere und bei den anderen dafür mehr bekomme. Abhängig davon, auf welche Kombinationen ich nicht setze und auf welche ich mehr setze, mache ich einen höheren oder geringeren Gewinn. Mehr als meinen gesamten Besitz kann ich nicht verwetten und das wären 100%.

Da ich auch keine rationale Erklärung bringen kann, darf sich jetzt der/die Nächste versuchen.
Hoffentlich habe ich jetzt nichts völlig Unverständliches oder gar Unsinniges erzählt oder zu sehr in Deinem Revier gewildert.
 

antimagnet

Forenlegende
Registriert
10. April 2002
Beiträge
9.676
Hoffentlich habe ich jetzt nichts völlig Unverständliches oder gar Unsinniges erzählt oder zu sehr in Deinem Revier gewildert.

ich schreib das mal groß, denn um eins klar zu stellen: ich kenn mich angewandter sozialwissenschaftlicher statistik aus, sprich: ich weiß, was man da so rechnen kann (besser: den computer rechnen lassen kann), wie man daten interpretiert, was gute daten auszeichnet und so. von der mathematik dahinter, insbesondere wahrscheinhlichkeitsrechnung und kombinatorik, da schlackern mir dermaßen die ohren, das einzige, was ich da sicher weiß, ist, dass es höllisch kompliziert ist...
 

Mother_Shabubu

Ehrenmitglied
Registriert
3. Juli 2003
Beiträge
2.237
ich weiß, was man da so rechnen kann (besser: den computer rechnen lassen kann),
Anders geht es in der Praxis vermutlich auch nicht mehr.
von der mathematik dahinter, insbesondere wahrscheinhlichkeitsrechnung und kombinatorik, da schlackern mir dermaßen die ohren, das einzige, was ich da sicher weiß, ist, dass es höllisch kompliziert ist...
Wobei man die Wahrscheinlichkeitsrechnung fast beliebig verkomplizieren kann, auch wenn man später als Anwender wenig davon braucht.

Die Zahlen von Bild sind aber vermutlich ohne größere theoretische Überlegungen entstanden und im Eifer des Gefechts wurden ein paar Absteiger zuviel getippt.
 

antimagnet

Forenlegende
Registriert
10. April 2002
Beiträge
9.676
hehe. hab das bild schon gespeichert und werds in meinen kursen verwenden...
 

antimagnet

Forenlegende
Registriert
10. April 2002
Beiträge
9.676
aus diesem thread:


[url=http://www.focus.de/politik/deutschland/terrorangst_aid_65700.html schrieb:
focus[/url]]Terrorangst
79 Prozent der Deutschen fürchten Anschläge


Die Deutschen haben derzeit mehr Angst vor Terror als unmittelbar nach den Anschlägen vom 11. September 2001.
[...]
Nach den Anschlägen auf das World Trade Center in New York im September 2001 befürchteten 77 Prozent der Deutschen Terrorakte in der Bundesrepublik.

lieber focus,

wenn man von 1.003 befragten auf ganz deutschland schließt, ist zwischen 77% und 79% kein unterschied feststellbar; das konfidenzintervall ist hier einfach zu groß.

außerdem haben die deutschen nicht mehr angst, sondern mehr deutsche haben angst. das ist ein unterschied.

und mich würde mich mal interessieren, was denn forsa da genau gefragt hat:

haben sie angst, dass sie opfer eines terroranschlags werden?
haben sie angst vor terroranschlägen in deutschland?
befürchten sie, dass es in deutschland zu terroranschlägen kommen könnte?
halten sie es für möglich, dass es in deutschland zu terroranschlägen kommt?
sind sie der meinung, dass es zur zeit in deutschland keine terrorgefahr gibt?

usw.

ich bin mir ziemlich sicher, dass je nach fragestellung da höchst unterschiedliche prozentzahlen rauskommen...
 

antimagnet

Forenlegende
Registriert
10. April 2002
Beiträge
9.676
juhuu, es gibt mal wieder was:

der pearson'sche korrelationskoeefizient

das ganze wurde ausgelöst durch diese diskussion.

es soll hier also um ein maß gehen, mit dem man die stärke eines je-desto-zusammenhangs beschreiben kann. also, z.b. je größer ein mensch, desto schwerer sein gewicht. die beiden beteiligten größen müssen metrisch sein, d.h. dass die ausprägungen "gleichabständig" sein müssen. d.h. der abstand zwischen 1,80m und 1,90m ist genau so groß wie zwischen 1,50 und 1,60. bei einer ordinal skalierten größe wie z.b. dem schulabschluss ist das nicht der fall. da könnte man zwar auch je-desto-zusammenhänge formulieren (à la "je höher der schulabschluss, desto höher das berufsprestige"), aber hier ist keine gleichabständigkeit gegeben. der abstand zwischen 1-hauptschule und 2-realschule ist nicht gleich dem abstand zwischen 2-realschule und 3-abitur. für letzteres gibt es auch einen korrelationskoeffizienten, nämlich den spearman'schen rangkorrelationskoeffizienten. aber um den soll es hier nicht gehen.

hier geht es um den pearson'schen korrelationskoeffizienten. er wird auch bravais-pearson-korrelationskoeffizient genannt, oder produkt-moment-korrelationskoeffizient, oder maßkorrelationskoeffizient, und weil das alles viel zu lange wörter sind, heißt er meist ganz einfach korrelationskoeffizient. dieser koeffizient wird mit dem buchstaben r abgekürzt (in der tat ein kleines r, nicht nur weil ich hier klein schreibe).

auf wiki wird der natürlich auch erklärt, aber dort in mathematischer und einer der allgemeinheit eher unverständlichen art und weise. das ist übrigens nicht arrogant gemeint, ich versteh das selber nicht. die haben da wieder diese unsägliche kovarianz mit drin, ein äh dingsbums, das meiner meinung keiner wirklich braucht. außer er will die korrelation so erklären, dass sie niemand versteht.

das soll nun hier anders sein. ich will die lorbeeren natürlich nicht selber ernten, ich hab das ganze von meinem lieblingsstatistiker walter krämer.

also: zusammenhänge zwischen zwei metrischen variablen kann man wunderbar als streudiagramm darstellen. die einzelnen punkte sind durch die messwertpaare bestimmt. unten auf der achse die körpergröße, links das gewicht.



es entsteht eine art punktwolke. geht sie von links unten nach rechts oben, ist die korrelation positiv (je größer a, desto größer b), geht sie von links oben nach rechts unten, ist sie negativ (je größer a, desto kleiner b).

weiterhin ist wichtig:

pearsons r
  • unterstellt einen linearen zusammenhang – vorstellbar als gerade, die durch die punktwolke geht (das ist die regressionsgerade) und
  • liegt zwischen –1 (perfekter neg. zus.hang) und +1 (perfekt pos. zus.hang); 0 = kein linearer(!) zusammenhang – nichtlineare (u-förmig) sind möglich!

die stärke wird üblicherweise (also zumindest in den sozialwissenschaften üblicherweise wie folgt interpretiert):



kommen wir endlich zur ersehnten berechnung:

zunächst hat man das bekannte streudiagramm mit der größe als x-achse und dem gewicht als y-achse (es wär dem koeffizienten übrigens auch wurscht, wenn das andersrum wäre), die mittelwerte sind als linien eingezeichnet.



dann wird es etwas (aber auch wirklich nur etwas) kompliziert. man muss die originalwerte z-transformieren. wiki erklärt das mal wieder mathematisch unverständlich. dazu kann ich gerne in was in einem späteren post ausführlicher werden, hier soll erstmal eine kurzerklärung reichen. nach einer z-transformation sind die original-werte in einer bestimmten weise standardisiert. d.h. es spielt keine rolle mehr, wie groß und wie schwer einer ist, sondern wie stark einer in größe und gewicht vom mittelwert abweicht. das streudiagramm ändert sich dadurch kaum, einzig die einheiten und die maßstäbe der achsen ändern sich (das wird jetzt nicht mehr in kilogramm und zentimetern gemessen, sondern in standardabweichungen. also, wieviel standardabweichungen ist einer vom mittelwert entfernt. that's all). also, das streudiagramm sieht dann wie folgt aus:



man sieht, dass die wolke kaum verändert ist (ok, ich gebs zu, ich hab das mit word selber gemalt, das ist nicht wirklich z-transformiert worden). die linien sind immer noch die mittelwerte, nur betragen die jetzt null. ist ja auch logisch, wer genau auf dem mittelwert liegt, hat zum mittelwert einen abstand von null standardabweichungen.

nun muss man von jedem punkt ein quadrat bilden, zu den mittelwertslinien. hab hier mal beispielhaft zwei quadrate eingezeichnet (die ecken liegen nicht genau in der ecke, word halt).



am ende muss man einfach die durchschnittsfläche von allen quadraten ausrechnen:



und man hat den pearson'schen korrelationskoeffizienten!

je näher die punkte an der regressionsgeraden liegen, desto größer wird der durchschnittswert aller quadrate, desto stärker ist auch der zusammenhang (die quadrate links oben und rechts unten haben ja negative flächen, versauen einem also den in diesem fall positiven zusammenhang).

ja, das war's auch eigentlich... eine ausführlichere erläuterung der z-transformation folgt. und jetzt, wie im seminar:

gibt's fragen dazu?
 

dkR

Forenlegende
Registriert
10. April 2002
Beiträge
6.523
Ist das das gleiche r (bzw r^2), dass mit bei meinen Regresionsgeraden und Verdünnungsreihen sagt, wie lausig ich pipettiert hab? Also wie genau meine Messwerte zu meiner Kurve passen? Ne, oder?
 

antimagnet

Forenlegende
Registriert
10. April 2002
Beiträge
9.676
doch, wahrscheinlich schon. aber soll deine messreihe zu einer geraden oder zu einer kurve passen? mit non-linearem kram kenn ich mich nämlich nicht so aus... 8)
 

dkR

Forenlegende
Registriert
10. April 2002
Beiträge
6.523
Gerade, meistens. Kurven eher seltener. Und selbst wenn Kurve, dann Gerade da log-Skala. :rofl:

Einigen wir uns auf Gerade?
 

antimagnet

Forenlegende
Registriert
10. April 2002
Beiträge
9.676
einigen wir uns auf gerade. nächste frage: sind das zeitreihen? also, wird jede woche oder so immer wieder verdünnt oder gleich auf einmal tausend röhrchen fertig gemacht?
 

dkR

Forenlegende
Registriert
10. April 2002
Beiträge
6.523
Das sind Verdünnungsreihen für Vergleichswerte. Alles auf einmal
In Dippchen 1 werden z.B. 1ml reingegeben, 0,5 ins nächste Dippchen, dann mit Wasser auf 1ml aufgefüllt, 0,5ml in Dippchen 3 und so weiter. Im Endeffekt hast du dann Dippchen mit 1ml, 0,5ml, 0,25ml etc. (immer im gleichen Volumen) daraus berechnet man dann eine Gerade und anhand der Geraden kann man dann rauskriegen, welche Konzentration die Proben hatten.
Ich hab das mal in meinem Blog für die Bradford-Proteinbestimmung kurz erläutert.
 
Ähnliche Beiträge

Ähnliche Beiträge

Oben