חציון: מדד מרכזי לקבוצה סדורה של נתונים חד-ממדיים

בסטטיסטיקה, החציון (קרוי גם המאון ה-50 או האחוזון ה-50) הוא מדד מרכזי לקבוצה סדורה של נתונים חד-ממדיים.

החציון מוגדר להיות ערך החוצה את הקבוצה, עם מספר שווה של ערכים מעליו ומתחתיו.

למשל, החציון של {1,2,3,8,10} הוא 3. כאשר מספר הנתונים אי-זוגי הגדרת החציון פשוטה, אולם כאשר הוא זוגי ההגדרה אינה חד-משמעית. נהוג לקבוע שבמקרים כאלה החציון הוא הממוצע של שני הנתונים המרכזיים.
תהי קבוצת נתונים חד-ממדיים סדורה, כלומר . החציון (median) מוגדר להיות

חציון גאומטרי הוא מדד מרכזי שמוגדר גם עבור קבוצות סדורות של נתונים רב-ממדיים.

לחציון תכונות מסוימות, המשותפות עם הממוצע, אולם הם שונים מהותית בהיבטים אחרים. ההבדל המשמעותי ביניהם הוא בכך שהחציון מתעלם מגודלם של הנתונים ולוקח בחשבון רק את הסדר שלהם. כך למשל החציון של הקבוצה {1,2,5} זהה לחציון של הקבוצה {1,2,1000}, על אף שהממוצעים של שתי הקבוצות שונים מאוד. בפרט, החציון פחות רגיש לשגיאות גדולות בערכים בודדים או לערכים חריגים, אבל גם לשינויים מהותיים בהתפלגות של הזנבות.

החציון ומדדי מיקום ופיזור

החציון הוא אחת ממספר דרכים לתמצת את הערכים הטיפוסיים המשויכים לאיברי המדגם, לכן זהו פרמטר מיקום (אנ') אפשרי.

כשהחציון משמש כפרמטר מיקום בסטטיסטיקה תיאורית, ישנן מספר דרכים למדוד את השונות: הטווח, הטווח הבין-רבעוני, הממוצע של הסטייה המוחלטת והחציון של הסטייה המוחלטת.

מסיבות מעשיות, ההשוואה בין מדדי מיקום ופיזור שונים, נעשית לרוב על בסיס טיב יכולת שיעור ערכי המדגם. לחציון יש תכונות טובות בהקשר הזה. אמנם לא מיטבי לשער התפלגות של אוכלוסיית המדגם, אך התוצאה בדרך כלל טובה במידה סבירה. לדוגמה, השוואת היעילות של דרכי הערכה אפשריות, מראה כי הממוצע סטטיסטית יותר יעיל מהחציון, כאשר המידע אינו מזוהם על ידי מידע מהתפלגויות בעלות זנב משמעותי או מהתפלגויות מעורבות, אבל אחרת פחות יעיל. לעומת זאת, היעילות של החציון גדולה יותר עבור מגוון רחב של התפלגויות. ליתר דיוק, לחציון יש 64% יעילות בהשוואה לזו של ממוצע בעל שונות מינימלית (עבור מדגמים נורמליים גדולים), כלומר השונות של החציון תהיה גדולה בכ-50% משונות הממוצע.

הגדרה פורמלית

כמדד של קבוצת נתונים, יש לחציון כמה הגדרות מקובלות שכולן שקולות אם הקבוצה כוללת מספר אי-זוגי של נתונים. במקרה זה, החציון שווה לערך המופיע במקום האמצעי לאחר סידור הנתונים. אם בקבוצה מספר זוגי של נתונים מסודרים, חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם , כל מספר שבין חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם  ו-חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם  עשוי להיחשב כחציון, וכאמור נהוג לרוב לבחור את הממוצע שבין שני ערכים אלה.

כאשר מדובר בנתונים מקובצים (למשל: כמה תלמידים קיבלו ציון שבין 61 ל-70), החציון שייך לקבוצה שפחות ממחצית הנתונים מעליה, ופחות ממחצית הנתונים מתחתיה, אם יש כזו. במקרה כזה מקובל למקם את החציון כאילו הנתונים בקבוצה שאליה הוא שייך היו מתפלגים באופן אחיד, וכך מחלק החציון את ההיסטוגרמה לשתי מחציות שוות-שטח. אם לא קיימת קבוצה כנזכר למעלה, אז קיימת נקודת חיתוך בין שתי קבוצות, החוצה את הנתונים לשתי קבוצות שוות, ואז מקובל לקבוע אותה כחציון.

הגדרת החציון חלה, באופן כללי יותר, בכל מקרה שבו הנתונים סדורים באופן מלא. במקרה זה, חציון תמיד קיים (לפחות אחד) אם לכל חתך של הטווח של המשתנה המקרי (דהיינו, חלוקת הטווח לשתי קבוצות הממצות אותו ואשר כל איבר באחת גדול מכל אחד מאברי השנייה) יש לפחות קבוצה אחת המרכיבה אותו שיש לה איבר הקטן ביותר ואיבר הגדול ביותר.

חציון של משתנה מקרי

בדומה לתוחלת, החציון מוגדר גם עבור משתנה מקרי ממשי X, בתור ערך חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם , המקיים:
גם חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם  וגם חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם . האופרטור M הוא הומוגני ושומר על הזזות (כלומר, חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם ); יתרה מזו, חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם  לכל פונקציה מונוטונית ממשית חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם . התוחלת של סכום משתנים מקריים שווה לסכום התוחלות, ובתנאים מסוימים טענה דומה נכונה גם עבור השונות. לעומת זאת, אין קשר ברור בין החציון של סכום משתנים לבין שני החציונים.

החציון של משתנה מקרי המקבל בהסתברות חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם  את הערך חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם  (כאשר חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם  והערכים חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם  אינם בהכרח שונים), שווה לחציון של סדרת הערכים חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם . מכיוון שכך, ניתן לראות בהגדרה לחציון של קבוצת ערכים, מקרה פרטי של ההגדרה למשתנים מקריים.

לדוגמה, החציון של התפלגות אחידה רציפה, הוא מרכז הקטע. החציון של התפלגות סימטרית, כגון ההתפלגות הנורמלית, שווה לתוחלת.

הגדרה כערך קיצון

את הממוצע x של קבוצת מספרים חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם  אפשר להגדיר כמספר (היחיד) שעבורו סכום הריבועים חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם  הוא הקטן ביותר. באופן דומה, מספר הממזער את סכום הערכים המוחלטים חציון: החציון ומדדי מיקום ופיזור, הגדרה פורמלית, ראו גם  נקרא חציון של הקבוצה. על-פי הגדרה זו, ישנם לקבוצה בגודל זוגי אינסוף ערכי חציון אפשריים (בדרך כלל); מקורות אחדים בוחרים אחד מן הערכים האלה להיות החציון, כפי שהוצע לעיל בבחירת הממוצע של שני הערכים המרכזיים.

ראו גם

קישורים חיצוניים

  • חציון, באתר MathWorld (באנגלית)

Tags:

חציון ה ומדדי מיקום ופיזורחציון הגדרה פורמליתחציון ראו גםחציון קישורים חיצונייםחציוןמאוןסדר מלאסטטיסטיקה

🔥 Trending searches on Wiki עברית:

נמל התעופה בן-גוריוןסוריהתאגד (סדרת טלוויזיה)יאיר לפידגדי איזנקוטאוזן המןהליכודאמישיצחק אברג'ילהפרעה דו-קוטביתאור בן מלך2024חצבתרובה M4אלברט איינשטייןמוחמד דףשלמהשבע מצוות בני נחדלתוןראשון לציוןהבחירות לרשויות המקומיות בישראל (2024)ריטהגולדה מאירמנחם מנדל שניאורסוןאלימלך מליז'נסקיזהר שיהאי (סדרת טלוויזיה)רוקדים עם כוכבים (קשת)מלחמת המפרץארבע פרשיותטרשת נפוצהטקס הדלקת המשואותהפשוטערומניהביטקויןבראול סטארסהשמיניה (סדרת טלוויזיה)פיקוד הצפוןליגת העל בכדורגלעמוד ראשיאלביט מערכותשילה אדלרשוגוןאיראןפלסטיניםאילון לוימוחמדשמעון פרסשירות הביטחון הכלליעין קנייאיונתן ברקמשהמלחמת העולם השנייהמנחם בגיןצרפתמילת קישורמגפת הקורונהדרגות משטרת ישראלטיפולתייםאלמוג כהן (חבר הכנסת)הארי פוטרנצח יהודהסרי לנקהילוסטון (סדרת טלוויזיה אמריקאית)מס ריבוי דירותהמן האגגידגל ישראלאריק איינשטייןשחמטאדולף היטלרשלמה ארציחות'יםדינה ליראובן עובדחולי אהבה (סדרת טלוויזיה)טענות למדיניות אפרטהייד על ידי ישראלחטיבת גבעתי🡆 More