Τετάρτη 27 Απριλίου 2022

“Στατιστική Συμπερασματολογία” και "Το θεώρημα του Μπέυζ"

 

“Στατιστική  Συμπερασματολογία”  και  "Το θεώρημα του Μπέυζ"



     Ο Μπέυζ (Thomas Bayes 1701 – 1761) ήταν Βρετανός κληρικός, που στη ζωή του ασχολήθηκε, εκτός από τη θεολογία, με τα μαθηματικά και τις φυσικές επιστήμες. Η Στατιστική τον απασχόλησε ιδιαίτερα, αλλά το μεγαλύτερο μέρος του έργου του στον τομέα αυτό είδε το φως της δημοσιότητας μετά το θάνατό του. Ιδιαίτερα σημαντικό είναι ένα δοκίμιό του με τίτλο: "An Essay towards solving a Problem in the Doctrine of Chances". Ο Bayes ασχολήθηκε κυρίως με τις “δεσμευμένες πιθανότητες” ή αλλιώς τις “υπό συνθήκη» πιθανότητες”.

Thomas Bayes (1701 – 1761)

   

  Περιώνυμο κατέστη θεώρημα που φέρει το όνομά του («Θεώρημα του Thomas Bayes») για το οποίον έχουν πει ότι είναι για τη Θεωρία Πιθανοτήτων, ότι το Πυθαγόρειο Θεώρημα για τη Γεωμετρία. Περιγράφει την πιθανότητα να συμβεί ένα ενδεχόμενο, αν γνωρίζουμε ότι ένα άλλο έχει ήδη συμβεί. Η παρακάτω εξίσωση αποδίδει το θεώρημα του Bayes, στην απλούστερη μορφή του:

Όπου:

-  A και B είναι γεγονότα, διαφορετικά μεταξύ τους και Ρ(Β) =/= 0.

- P(A) και P(B) είναι οι πιθανότητες των A και B.

- P(A|B) και P(B|A) είναι “υπό συνθήκη πιθανότητες” και δη:

- P(A|B) είναι η πιθανότητα του γεγονότος A, με δεδομένο το γεγονός B να είναι αληθές.

- P(B|A), είναι η πιθανότητα του γεγονότος B, με δεδομένο το γεγονός A να είναι αληθές.

 

“Μπεϋζιανή / Bayesian στατιστική”


Icon representing Bayesian statistics

     Η φιλοσοφία της “Μπεϋζιανής / Bayesian στατιστικής” βρίσκεται στον πυρήνα σχεδόν κάθε σύγχρονης προσεγγιστικής εκτίμησης που περιλαμβάνει εξαρτημένες πιθανότητες, όπως διαδοχική εκτίμηση, πιθανοτικές τεχνικές μηχανικής μάθησης, αξιολόγηση κινδύνου, ταυτόχρονο εντοπισμό και χαρτογράφηση, νομιμοποίηση ή θεωρία πληροφοριών.

     Περαιτέρω, “Μπεϋζιανή πιθανότητα” είναι το όνομα που δίνεται σε πολλές σχετικές ερμηνείες της πιθανότητας ως ένα ποσό επιστημικής εμπιστοσύνης (ισχύς των πεποιθήσεων, υποθέσεων κ.λπ.) και όχι ως συχνότητα. Και “Μπεϋζιανή στατιστική” είναι θεωρία στον τομέα της στατιστικής που βασίζεται στην ερμηνεία της Μπεϋζιανής πιθανότητας, όπου η πιθανότητα εκφράζει έναν βαθμό πίστης σε ένα γεγονός .

     Το “Συμπέρασμα Bayes” είναι μια μέθοδος στατιστικής εξαγωγής συμπερασμάτων στην οποία το θεώρημα του Bayes χρησιμοποιείται για την ενημέρωση της πιθανότητας για μια υπόθεση, καθώς διατίθενται περισσότερα στοιχεία ή πληροφορίες. “Το συμπέρασμα Bayes” είναι μια σημαντική τεχνική στη μαθηματική στατιστική. Η “Μπεϋζιανή / Bayesian ενημέρωση” είναι ιδιαίτερα σημαντική στη δυναμική ανάλυση μιας ακολουθίας δεδομένων. Τα “συμπεράσματα του Bayes” έχουν βρει εφαρμογή σε ευρύ φάσμα δραστηριοτήτων, όπως στις επιστήμες, στη φιλοσοφία, στη κβαντική μηχανική, στη ρομποτική, στην ιατρική, στην τεχνητή νοημοσύνη και αποκρυπτογράφηση του ανθρώπινου εγκεφάλου, στον αθλητισμό, στο μάρκετινγκ, στη νομοθεσία.  

     Στη “φιλοσοφία της θεωρίας αποφάσεων”, το συμπέρασμα του Μπέυζ σχετίζεται στενά με την υποκειμενική πιθανότητα, που συχνά καλείται "Μπεϋζιανή πιθανότητα".

     Γνωστόν ότι η Στατιστική, κλάδος των Μαθηματικών, είναι χρήσιμη σε όλους τους κλάδους της επιστήμης, ειδικά τη σημερινή εποχή. Όμως, τ’ αποτελέσματά της δεν είναι ακριβή, αλλά προσεγγιστικά, και σε αρκετές περιπτώσεις (και αυτό ισχύει και για το  θεώρημα του Μπέυζ) δεν συμβαδίζουν με την συνηθισμένη λογική.

     Το παρακάτω παράδειγμα, ως τίθεται κατά την μεθοδολογία του T. Bayes, είναι χαρακτηριστικό:

-  Έστω τεστ που με περιθώριο λάθους (βαθμός εμπιστοσύνης / level of confidence) 5% μπορεί να ανιχνεύσει, με ένδειξη θετικό / αρνητικό, την ύπαρξη κάποιας ασθένειας στον άνθρωπο. Ομάδα 1.000 ατόμων, για την οποία γνωρίζουμε με βεβαιότητα ότι 5 μέλη της νοσούν απ’ αυτή την ασθένεια (οι υπόλοιποι 995 είναι υγιείς) καλείται να εξεταστεί, υποβαλλόμενη στο πιο πάνω τεστ. Το ερώτημα είναι:  Πόσα άτομα θα βγουν «θετικοί», δηλ. ασθενείς, από αυτό το τεστ;

     Απάντηση:  Από το  υποσύνολο των 5 πραγματικά άρρωστων θα βγουν θετικοί:  5 Χ 95%  =  4,75   άτομα, ενώ απ’ αυτό των 995 υγειών,  θα βγουν θετικοί:  995  Χ  5%  = 49,75   άτομα.  Άρα, στο σύνολο του δείγματος των 1.000 ατόμων, θα έχουμε συνολικά: 4,75 + 49 75 = 54,50 άτομα, με ένδειξη «θετικό» (δηλ. ασθενείς).

     Παρατήρηση - Συμπέρασμα:  Ακόμα κι αυτό, το μικρό περιθώριο σφάλματος της τάξης του 5%, οδηγεί σε σοβαρή απόκλιση από την πραγματικότητα, αφού το τεστ θα δείξει 54,5 θετικούς (δηλ. ασθενείς), ενώ στην πραγματικότητα μόνον 5 άτομα, ξέρουμε με βεβαιότητα ότι, νοσούν πραγματικά.

     Η απόκλιση μεγαλώνει, όσο μεγαλώνει και  το πεδίο εφαρμογής της μεθόδου. Έτσι, στο πλήθος των 5 ατόμων (των ασθενών) η απόκλιση είναι μικρή, ενώ σ’ αυτό των 995 (των υγειών) είναι μεγάλη.

     Πάντως, στο συγκεκριμένο πιο πάνω παράδειγμα, όποιος στο τεστ διαγνωστεί ασθενής, μπορεί να αισιοδοξεί ότι υπάρχει πάρα πολύ μεγάλη πιθανότητα να έχει γίνει λάθος!  Να έχει βγει “θετικός” στην ασθένεια λόγω λάθους/ σφάλματος της μεθόδου, αφού από τους 54,5 “θετικούς” κατά το τεστ, μόνο οι 5 είναι όντως ασθενείς (ποσοστό 9,17%)!  

      Υ. Γ. Ας συνεκτιμηθεί και ότι, καθώς λέγεται,…… «Υπάρχουν τρεις κατηγορίες ψέματα: 1) Τα «κατά συνθήκην» μικρά καθημερινά, 2) τα «Τερατώδη» και 3) τα «Στατιστικά στοιχεία»!......"There are three kinds of lies: lies, damned lies, and statistics".  («Υπάρχουν τρία είδη ψεμάτων: τα ψέματα, τα καταραμένα (εξωφρενικά) ψέματα και τα στατιστικά στοιχεία»). Την πατρότητά της παραπάνω φράσης, διεκδικούν ο Mark Twain ο πάλαι ποτέ πρωθυπουργός του U.K. Benjamin Disraeli, o Sir Charles Dilke και άλλοι. Τελικά, οφείλεται σ’ ένα ανώνυμο συγγραφέα γύρω στο 1891.



Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου