ค่าผิดปกติคือ การสังเกตที่มีระยะห่างผิดปกติจากค่าอื่นในตัวอย่างสุ่มจากประชากร ในแง่หนึ่ง คำจำกัดความนี้ปล่อยให้นักวิเคราะห์ (หรือ กระบวนการฉันทามติ) เพื่อตัดสินว่าอะไรจะถือว่าผิดปกติ … จุดเหล่านี้มักถูกเรียกว่าค่าผิดปกติ
ตัวอย่างสถิติผิดปกติคืออะไร
ค่าที่ "อยู่ภายนอก" (เล็กกว่าหรือใหญ่กว่ามาก) ของค่าอื่นๆ ส่วนใหญ่ในชุดข้อมูล ตัวอย่างเช่น ในคะแนน 25, 29, 3, 32, 85, 33, 27, 28 ทั้ง 3 และ 85 เป็น "ค่าผิดปกติ "
คุณค้นหาค่าผิดปกติในข้อมูลได้อย่างไร
การกำหนดค่าผิดปกติ
การคูณช่วงระหว่างควอไทล์ (IQR) ด้วย 1.5 จะทำให้เราสามารถระบุได้ว่าค่าใดค่าหนึ่งเป็นค่าผิดปกติหรือไม่ หากเราลบ 1.5 x IQR จากควอร์ไทล์แรก ค่าข้อมูลที่น้อยกว่าตัวเลขนี้จะถือเป็นค่าผิดปกติ
อะไรถือเป็นค่าผิดปกติทางสถิติ
ค่าผิดปกติคือ การสังเกตที่อยู่นอกรูปแบบโดยรวมของการแจกแจง (Moore และ McCabe 1999) … คำจำกัดความที่สะดวกของค่าผิดปกติคือจุดที่ตกลงมากกว่า 1.5 เท่าของช่วงระหว่างควอร์ไทล์เหนือควอร์ไทล์ที่สามหรือต่ำกว่าควอร์ไทล์แรก
ทำไมค่า IQR ถึง 1.5 เท่า
ทำไมเราใช้ 1.5IQR:
เปรียบเทียบสิ่งนี้ - แบบศึกษาสำนึก - ด้วยการแจกแจงแบบปกติโดยที่ 68% อยู่ภายใน ±σ ดังนั้นในกรณีนี้ IQR จะน้อยกว่า σ เล็กน้อย การตัดที่ ±1.5IQR จึงเป็น เทียบได้กับการตัดที่ต่ำกว่า ±3σ เล็กน้อย ซึ่งจะประกาศประมาณ 1% ของค่าผิดปกติของการวัด