לעיתים יש לנו שתי השערות על פרמטר מסוים באוכלוסייה וצריך להחליט איזה מהן נכונה. ניקח מדגם, על סמך תוצאות המדגם נחליט איזו מהן נכונה.
דוגמאות:
א.רופא טוען ששיטת טיפול חדשה שפיתח, מקצרת את משך ההחלמה של מחלה ספציפית.
ב.איש חינוך טוען שפיתח שיטת לימוד חדשה המשפרת את יכולות התלמידים.
ג.דוגמת בית משפט. בהמשך נרחיב על דוגמת בית המשפט.
ד.רוצים לבדוק האם קיים קשר בין מין ועישון.
שלבים בבעיות הסקה סטטיסטית
1.קביעת מטרות – ניסוח השערות
יש לנו שתי השערות:
I.השערת האפס - Hypothesis = H0
II.ההשערה הנגדית - H1 נקראת גם ההשערה האלטרנטיבית והשערת המחקר.
H0 מתארת בדרך כלל את המצב הקיים, את השיטה הקיימת , השיטה לפיה נוהגים בחיי היום יום.
H1 מתארת בדרך כלל את הרעיון החדש, הניסוי החדש, שינוי באורחות החיים למשל האם להחליף את שיטת ההוראה הקיימת, את שיטת הטיפול ועוד. H1 מתארת את מה שהחוקר רוצה לבדוק או להוכיח.
השערת האפס "ספקנית"/"שמרנית". כלומר היא מניחה שהשיטה הקיימת אינה נופלת מהחידוש המוצע ולכן החידוש המוצע אינו כדאי
לדוגמא :
א.דוגמת הרופא.
שיטת הטיפול החדשה אינה עדיפה - H0
שיטת הטיפול החדשה עדיפה - H1
ב.דוגמת בית המשפט
הנאשם אשם - H0
הנאשם חף מפשע- H1
2.תכנון הניסוי וביצועו
קביעת גודל מדגם, איסוף נתונים ועיבוד הנתונים. (למשל ע"י קבוצת ניסוי וקבוצת ביקורת).
3.קביעת החלטות ומסקנות
על סמך תוצאות הניסוי (מדגם). יכולות להיות שתי החלטות
א.לדחות את H0: זוהי ההחלטה האומרת שהשערת האפס אינה נכונה. דהיינו דווקא האלטרנטיבה היא הנכונה.(מקבלים את הרעיון החדש, הניסוי החדש או שינוי באורחות החיים).
ב.אי דחייתה של H0 (לפעמים אומרים גם קבלת H0): זוהי החלטה האומרת שהשערת האפס אינה ניתנת להידחות והיא כנראה נכונה.
הערות:
1. היחס להשערות אינו סימטרי. אין מנסים להוכיח את H0 אלא מניחים את נכונותה ודבקים בה כל עוד אין עדות מכרעת (על סמך תוצאות המדגם ) לטובת ההשערה האלטרנטיבית H1.
2. כמו כן במבחני השערות (כמו בעולם המשפט) אין דורשים וודאות מלאה כדי לדחות את השערת האפס (לגזור "אשם" על נידון") במקום זאת מסתפקים בעדות מכרעת שתפיג את רוב הספקות.
טעויות במסקנות
בכל החלטה : לדחות או לקבל את H0 יכולות להיות 2 טעויות:
1.טעות מסוג I – הטעות נגרמת מכך שמחליטים לדחות את H0 בטעות. כלומר: להחליט לדחות את H0 כאשר המצב האמיתי הוא ש- H0 נכון.
2.טעות מסוג II – הטעות הנגרמת מכך שמקבלים את H0. כלומר: להחליט לקבל את H0 כאשר המצב האמיתי הוא H1 נכון.
נדגים בדוגמת בית המשפט:
הנאשם הוא אשם- H1
הנאשם חף מפשע- H0
טעות מסוג I: להחליט שהנאשם אשם כשהוא חף מפשע.
טעות מסוג II: להחליט שהנאשם חף מפשע כשהוא אשם.
הערה: לא ניתן לדעת מראש אם נעשו טעויות מסוג I או מסוג II, אלא לכשעובר זמן והנזק הוא בלתי הפיך, ולכן נחשב את ההסתברויות לטעות מסוג I ומסוג II. נשאף לכך שההסתברויות לטעויות תהינה קטנות. במקרה זה נאמר שהניסוי אמין, כלומר ניתן להסתמך על התוצאות שלו.
סיכום הטעויות
להחליט לקבל את H0 | להחליט לדחות את H0 | |
רמת ביטחון: | הסתברות לטעות מסוג I
| מצב אמיתי: H0 - נכון |
הסתברות לטעות מסוג II
| עוצמה (Power)
| מצב אמיתי: H1 - נכון |
יש לשים לב:
1. נקראת גם רמת המובהקות והיא מייצגת את ההסתברות המקסימאלית לטעות מסוג ראשון. 2. היא העוצמה והיא ההסתברות לדחות את H0 כאשר H1 נכון. העוצמה היא מדד למידת חוזקו של הניסוי למידת אמינותו. העוצמה נעה בין 1+ ל- 0, ככל שהעוצמה שואפת ל1 נאמר שהמבחן יותר חזק.
הערות על הטעויות בהסקה
החוקר שואף שגם וגם תהיינה קטנות ככל האפשר. אולם הטעויות הן זו על חשבון זו, כך שהקטנת הטעות מסוג ראשון מגדילה את הטעות מסוג שני ולהיפך. ולכן נבחר מראש קטן כרצוננו, כך שנשלוט ב- ואילו את נחשב. בדרך כלל נבחר שלא יעלה על 10%. נהוג לבחור שווה ל-1% ,5%,או 10%. אנו מעדיפים לבחור את קטן כרצוננו (ולא את ) שכן הנזק הנגרם מ- הוא גדול יותר. נראה זאת בהמשך בדוגמת בית המשפט.
נוח לחשוב על מערכת המשתמשת בערכים קטנים של על חשבון הגדלת כעל מערכת "שמרנית". כלומר, מערכת שבה נזהרים ביותר מהכנסת שינויים, שמא יהיו לא מוצדקים, אפילו זה על חשבון ויתור על מספר רב של רעיונות חדשניים טובים. לעומת זאת, שימוש בערך קטן של על חשבון מאפיין מערכת "ליברלית" שבה מוכנים לעיתים קרובות להשלים עם הכנסת שינוי לא מוצדק ובלבד שלא לוותר על אימוץ רעיונות חדשניים.
סיבה נוספת לשמירה על ערך קטן של , דהיינו שמרנות והתנגדות לשינויים תכופים, היא קיומם של מספר רב של "ממציאים" ו"מומחים" מהם בעלי עניין ( שרלטנים ), המנסים כל הזמן לשנות כל הזמן את אורחות חיינו ובמיוחד את הרגלי הצריכה שלנו. (לעיתים מפרסמים סקרים מגמתיים וכו'). אלמלא ה"שמרנות " היינו צריכים לשנות את שיטת הלימוד כל שנה, לשנות הרגלים בתחום התזונה, פעילות גופנית וכו', שכן רב הוא מספר ה"מומחים" התימהוניים המנסים ללמד אותנו כל הזמן שיטות חדשות.
חשוב להדגיש שהיחס לטעויות אינו סימטרי: הנזק הנגרם בעקבות טעות ההחלטה אינו זהה בדרך כלל לגבי שתי הטעויות.
למשל בדוגמת בית המשפט: הנזק הנגרם מטעות מסוג ראשון רב יותר מזה הנגרם מטעות מסוג שני.
רמת מובהקות מינימאלית ( מובהקות התוצאה P-Value)
הגדרה
רמת המובהקות המינימאלית היא ההסתברות לקבל בניסוי את תוצאת המדגם או תוצאה חריגה לה. האם המתאם המאפיין את המדגם משקף את מה שקורה באוכלוסייה. רמת מובהקות של 0.05.
p<0.05 תוצאה מובהקת, p ≥0.05 תוצאה שאינה מובהקת סטטיסטית.
הסימון: P.V. (ב-SPSS הסימון הוא Sig)
הכלל קובע:
דוחים את H0 עבור כל P.V קטן או שווה ל- . מקבלים את H0 עבור כל P.V גדול מ- .