על ידי עדי_רן* » 14 יולי 2003, 21:11
אסתכן בלהוסיף עוד קיסם למדורה: משתנים אקראיים בלתי מתואמים אינם בהכרח בלתי תלויים. למשל, אם x מפולג אחיד בין מינוס 1 ל-1, ו-y מוגדר כערך המוחלט של x, אז המתאם בין x ל-y הוא 0 (כך יוצא בחישוב) ולכן הם בלתי מתואמים. מאידך, הם לא בלתי תלויים כלל וכלל: בהינתן x, ברור ש-y ידוע בוודאות.
ועכשיו, דוגמאות ללא-מתמטיקאים, להמחשת המושג מתאם (בלי נוסחאות).
נסתכל על אוכלוסיה מסוימת, למשל, תלמידי כתה י"ב בכל בתי הספר בארץ.
נבדוק תכונות מסוימות שיש לכל פרט באוכלוסיה ושניתן לתת להן ערך מספרי. למשל, גובה בסנטימטרים; משקל בק"ג (בזמן נתון); שעת הלידה, בשניות מחצות הלילה; וכו'.
אם מסתכלים על אדם ספציפי, כל תכונה כזאת היא מספר. למשל, משה כהן: 175, 75, 15432.
אבל אם מסתכלים על כלל האוכלוסיה, לכל תכונה יש הרבה ערכים אפשריים. תכונה כזו היא מה שנקרא
משתנה אקראי_. למשתנה אקראי אפשר לחשב ממוצע (המונח המדויק הוא _תוחלת), ועוד דברים פחות מוכרים כמו סטיית תקן, שונות, חציון וכו'.
מתאם מתאר סוג של קשר בין שני משתנים אקראיים. בדוגמאות שלעיל: נניח שממוצע הגובה הוא 165 ס"מ וממוצע המשקל הוא 65 ק"ג. נניח שאני צריך להמר על משקלו של יוסי לוי (ומשלמים לי לפי הקירבה למשקל האמיתי). אם אין לי מידע נוסף, אני אהמר על הממוצע. אם אני יודע שיוסי לוי הוא בגובה 200 ס"מ (גבוה משמעותית מהממוצע), אני יכול להניח שמשקלו גבוה משמעותית מ-65 ק"ג. ייתכן שאני טועה, אבל אם אסתמך על המידע הזה בהימור, זה יעזור לי ברוב המקרים. זה אומר שיש מתאם חיובי בין המשקל והגובה: אם האחד גדול, סביר שגם השני גדול.
יש גם מתאם שלילי: נבדוק לכל תלמיד את המרחק שהוא יכול לעבור ב-10 דקות. נניח שהממוצע באוכלוסיה הוא 1 ק"מ. אם אני יודע שמשקלה של חנה ישראלי הוא 75 ק"ג, אני יכול להמר שהיא תעבור מרחק קטן יותר מהממוצע. כאן, יש מתאם שלילי בין המשקל למהירות הריצה: אם האחד גדול, סביר שהשני קטן.
יש גם מתאם אפס: למשל, אם אני יודע את שעת הלידה של רות שוורץ, זה כנראה (למיטב ידיעתי) לא יעזור לי לנחש שום נתון אחר עליה.
מה הערך המדויק של המתאם? זו שאלה לסטטיסטיקאים והתשובה לא מעניינת (ואני גם לא זוכר איך מחשבים
) אבל בסופו של דבר, מתאם בין שני משתנים אקראיים הוא מספר בין מינוס 1 ל-1.
ואם נחזור לעניין המבחנים: הטענה שלי שיש מתאם חיובי, משמעותה שאם אני יודע משהו על הציונים שאדם מסוים השיג במערכת החינוך, זה יכול לעזור לי בהחלטה אם לקבל אותו ללימודים גבוהים או לעבודה (החלטה שהיא בעצם הימור). גם מתאם שלילי יכול לעזור בהחלטה. אבל אם המתאם הוא אפס, אין לי טעם לבחון את הציונים, ולמעשה חבל על הזמן שהאדם השקיע בבחינות.
למעשה הדבר החשוב הוא לא אם יש מתאם חיובי (או שלילי) אלא עד כמה המתאם רחוק מ-0. ככל שהמתאם רחוק יותר, שווה לי יותר להסתכל על הציונים. ואכן, עד כמה הוא רחוק מ-0? זו שאלה שאין לי תשובה עליה.
אסתכן בלהוסיף עוד קיסם למדורה: משתנים אקראיים בלתי מתואמים אינם בהכרח בלתי תלויים. למשל, אם x מפולג אחיד בין מינוס 1 ל-1, ו-y מוגדר כערך המוחלט של x, אז המתאם בין x ל-y הוא 0 (כך יוצא בחישוב) ולכן הם בלתי מתואמים. מאידך, הם לא בלתי תלויים כלל וכלל: בהינתן x, ברור ש-y ידוע בוודאות.
ועכשיו, דוגמאות ללא-מתמטיקאים, להמחשת המושג מתאם (בלי נוסחאות).
נסתכל על אוכלוסיה מסוימת, למשל, תלמידי כתה י"ב בכל בתי הספר בארץ.
נבדוק תכונות מסוימות שיש לכל פרט באוכלוסיה ושניתן לתת להן ערך מספרי. למשל, גובה בסנטימטרים; משקל בק"ג (בזמן נתון); שעת הלידה, בשניות מחצות הלילה; וכו'.
אם מסתכלים על אדם ספציפי, כל תכונה כזאת היא מספר. למשל, משה כהן: 175, 75, 15432.
אבל אם מסתכלים על כלל האוכלוסיה, לכל תכונה יש הרבה ערכים אפשריים. תכונה כזו היא מה שנקרא [u]משתנה אקראי_. למשתנה אקראי אפשר לחשב ממוצע (המונח המדויק הוא _תוחלת[/u]), ועוד דברים פחות מוכרים כמו סטיית תקן, שונות, חציון וכו'.
מתאם מתאר סוג של קשר בין שני משתנים אקראיים. בדוגמאות שלעיל: נניח שממוצע הגובה הוא 165 ס"מ וממוצע המשקל הוא 65 ק"ג. נניח שאני צריך להמר על משקלו של יוסי לוי (ומשלמים לי לפי הקירבה למשקל האמיתי). אם אין לי מידע נוסף, אני אהמר על הממוצע. אם אני יודע שיוסי לוי הוא בגובה 200 ס"מ (גבוה משמעותית מהממוצע), אני יכול להניח שמשקלו גבוה משמעותית מ-65 ק"ג. ייתכן שאני טועה, אבל אם אסתמך על המידע הזה בהימור, זה יעזור לי ברוב המקרים. זה אומר שיש מתאם חיובי בין המשקל והגובה: אם האחד גדול, סביר שגם השני גדול.
יש גם מתאם שלילי: נבדוק לכל תלמיד את המרחק שהוא יכול לעבור ב-10 דקות. נניח שהממוצע באוכלוסיה הוא 1 ק"מ. אם אני יודע שמשקלה של חנה ישראלי הוא 75 ק"ג, אני יכול להמר שהיא תעבור מרחק קטן יותר מהממוצע. כאן, יש מתאם שלילי בין המשקל למהירות הריצה: אם האחד גדול, סביר שהשני קטן.
יש גם מתאם אפס: למשל, אם אני יודע את שעת הלידה של רות שוורץ, זה כנראה (למיטב ידיעתי) לא יעזור לי לנחש שום נתון אחר עליה.
מה הערך המדויק של המתאם? זו שאלה לסטטיסטיקאים והתשובה לא מעניינת (ואני גם לא זוכר איך מחשבים :-]) אבל בסופו של דבר, מתאם בין שני משתנים אקראיים הוא מספר בין מינוס 1 ל-1.
ואם נחזור לעניין המבחנים: הטענה שלי שיש מתאם חיובי, משמעותה שאם אני יודע משהו על הציונים שאדם מסוים השיג במערכת החינוך, זה יכול לעזור לי בהחלטה אם לקבל אותו ללימודים גבוהים או לעבודה (החלטה שהיא בעצם הימור). גם מתאם שלילי יכול לעזור בהחלטה. אבל אם המתאם הוא אפס, אין לי טעם לבחון את הציונים, ולמעשה חבל על הזמן שהאדם השקיע בבחינות.
למעשה הדבר החשוב הוא לא אם יש מתאם חיובי (או שלילי) אלא עד כמה המתאם רחוק מ-0. ככל שהמתאם רחוק יותר, שווה לי יותר להסתכל על הציונים. ואכן, עד כמה הוא רחוק מ-0? זו שאלה שאין לי תשובה עליה.