การถดถอยเชิงเส้นต้องการการแจกแจงแบบปกติหรือไม่

การถดถอยเชิงเส้นต้องการการแจกแจงแบบปกติหรือไม่
การถดถอยเชิงเส้นต้องการการแจกแจงแบบปกติหรือไม่
Anonim

การถดถอยเชิงเส้น โดยตัวมันเองไม่ต้องการสมมติฐานปกติ (เกาส์เซียน) ตัวประมาณสามารถคำนวณได้ (โดยกำลังสองน้อยที่สุดเชิงเส้น) โดยไม่ต้องมีสมมติฐานดังกล่าว และทำให้สมบูรณ์แบบ ความรู้สึกที่ไม่มีมัน … ในทางปฏิบัติ แน่นอนว่าการแจกแจงแบบปกตินั้นเป็นนิยายที่สะดวกที่สุด

การถดถอยจำเป็นหรือไม่

การถดถอยถือว่าปกติสำหรับตัวแปรผลลัพธ์เท่านั้น การไม่ปกติในตัวทำนายอาจสร้างความสัมพันธ์ที่ไม่เป็นเชิงเส้นระหว่างพวกมันกับ y แต่นั่นเป็นประเด็นที่แยกจากกัน … ความพอดีไม่ต้องการความปกติ

คุณใช้การถดถอยเชิงเส้นได้ไหมถ้าข้อมูลไม่กระจายแบบปกติ

โดยย่อ เมื่อไม่มีการกระจายตัวแปร dependent ตามปกติ การถดถอยเชิงเส้นยังคงเป็นเทคนิคที่มีเสียงทางสถิติในการศึกษาตัวอย่างขนาดใหญ่ รูปที่ 2 แสดงขนาดตัวอย่างที่เหมาะสม (เช่น >3000) ซึ่งยังคงสามารถใช้เทคนิคการถดถอยเชิงเส้นได้แม้ว่าจะละเมิดสมมติฐานปกติก็ตาม

จะเกิดอะไรขึ้นหากไม่มีการกระจายข้อมูลตามปกติ

ข้อมูลไม่เพียงพอสามารถ ทำให้การแจกแจงแบบปกติดูกระจัดกระจายโดยสิ้นเชิง ตัวอย่างเช่น โดยปกติผลการทดสอบในห้องเรียนมักจะแจกแจงแบบปกติ ตัวอย่างที่รุนแรง: หากคุณสุ่มเลือกนักเรียนสามคนและพล็อตผลลัพธ์บนกราฟ คุณจะไม่ได้รับการแจกแจงแบบปกติ

คุณจะรู้ได้อย่างไรว่าข้อมูลไม่ปกติกระจาย

หากข้อมูลที่สังเกตได้สมบูรณ์ตามการแจกแจงแบบปกติ ค่าของสถิติ KS จะเป็น 0 ค่า P จะใช้ตัดสินว่าส่วนต่างมากพอที่จะปฏิเสธหรือไม่ สมมติฐานว่าง: … ถ้า P-Value ของการทดสอบ KS น้อยกว่า 005 เราไม่ถือว่าการแจกแจงแบบปกติ