สารบัญ:
วีดีโอ: ค่าผิดปกติในการวิเคราะห์ข้อมูลคืออะไร?
2024 ผู้เขียน: Lynn Donovan | [email protected]. แก้ไขล่าสุด: 2023-12-15 23:54
ในสถิติ an ค่าผิดปกติ คือ ข้อมูล จุดที่แตกต่างจากข้อสังเกตอื่นๆ อย่างมาก หนึ่ง ค่าผิดปกติ อาจเป็นเพราะความแปรปรวนในการวัดหรืออาจบ่งบอกถึงข้อผิดพลาดในการทดลอง อันหลังบางครั้งก็ถูกแยกออกจาก ข้อมูล ชุด. หนึ่ง ค่าผิดปกติ อาจทำให้เกิดปัญหาร้ายแรงใน การวิเคราะห์ทางสถิติ.
เมื่อพิจารณาถึงสิ่งนี้ คุณจะค้นหาค่าผิดปกติในข้อมูลได้อย่างไร
จุดที่อยู่นอก ข้อมูล innerfences ของชุดถูกจัดประเภทเป็นผู้เยาว์ ค่าผิดปกติ ในขณะที่อันที่อยู่นอกรั้วชั้นนอกจัดเป็นวิชาเอก ค่าผิดปกติ . เพื่อค้นหารั้วด้านในของคุณ ข้อมูล ตั้งค่าก่อน คูณพิสัยระหว่างควอไทล์ด้วย 1.5 จากนั้น บวกผลลัพธ์ใน Q3 และลบออกจาก Q1
ด้านบนนี้ ฉันควรลบค่าผิดปกติออกจากข้อมูลของฉันหรือไม่ สำหรับ NS ส่วนใหญ่ ถ้า ข้อมูลของคุณ ได้รับผลกระทบจากกรณีรุนแรงเหล่านี้ คุณ สามารถ ผูกพัน NS ป้อนข้อมูลให้กับตัวแทนทางประวัติศาสตร์ของ ข้อมูลของคุณ ที่ไม่รวม ค่าผิดปกติ . พิจารณาเป็นกรณีๆ ไป อะไร NS ผลกระทบของ ค่าผิดปกติ เคยเป็น. จากนั้นตัดสินใจว่าคุณต้องการ ลบ , เปลี่ยนหรือเก็บ theoutlier ค่า
ในแง่นี้ การวิเคราะห์ข้อมูลจัดการกับค่าผิดปกติอย่างไร
นี่คือสี่แนวทาง:
- ทิ้งบันทึกค่าผิดปกติ ในกรณีของ Bill Gates หรือค่าผิดปกติอื่น บางครั้งก็เป็นการดีที่สุดที่จะลบบันทึกนั้นออกจากชุดข้อมูลของคุณทั้งหมด เพื่อไม่ให้บุคคลหรือเหตุการณ์นั้นบิดเบือนการวิเคราะห์ของคุณ
- ปิดข้อมูลค่าผิดปกติของคุณ
- กำหนดค่าใหม่
- ลองแปลงร่าง.
ตัวอย่างของค่าผิดปกติคืออะไร?
Outlier . more ค่าที่ "อยู่ภายนอก" (น้อยกว่าหรือใหญ่กว่า) ค่าอื่นๆ ส่วนใหญ่ในชุดข้อมูล สำหรับ ตัวอย่าง ในคะแนน 25, 29, 3, 32, 85, 33, 27, 28 ทั้ง3 และ 85 คือ " ค่าผิดปกติ ".