สารบัญ:

ค่าผิดปกติในการวิเคราะห์ข้อมูลคืออะไร?
ค่าผิดปกติในการวิเคราะห์ข้อมูลคืออะไร?

วีดีโอ: ค่าผิดปกติในการวิเคราะห์ข้อมูลคืออะไร?

วีดีโอ: ค่าผิดปกติในการวิเคราะห์ข้อมูลคืออะไร?
วีดีโอ: R 07_ค่าผิดปกติ หรือ Outlier case 2024, อาจ
Anonim

ในสถิติ an ค่าผิดปกติ คือ ข้อมูล จุดที่แตกต่างจากข้อสังเกตอื่นๆ อย่างมาก หนึ่ง ค่าผิดปกติ อาจเป็นเพราะความแปรปรวนในการวัดหรืออาจบ่งบอกถึงข้อผิดพลาดในการทดลอง อันหลังบางครั้งก็ถูกแยกออกจาก ข้อมูล ชุด. หนึ่ง ค่าผิดปกติ อาจทำให้เกิดปัญหาร้ายแรงใน การวิเคราะห์ทางสถิติ.

เมื่อพิจารณาถึงสิ่งนี้ คุณจะค้นหาค่าผิดปกติในข้อมูลได้อย่างไร

จุดที่อยู่นอก ข้อมูล innerfences ของชุดถูกจัดประเภทเป็นผู้เยาว์ ค่าผิดปกติ ในขณะที่อันที่อยู่นอกรั้วชั้นนอกจัดเป็นวิชาเอก ค่าผิดปกติ . เพื่อค้นหารั้วด้านในของคุณ ข้อมูล ตั้งค่าก่อน คูณพิสัยระหว่างควอไทล์ด้วย 1.5 จากนั้น บวกผลลัพธ์ใน Q3 และลบออกจาก Q1

ด้านบนนี้ ฉันควรลบค่าผิดปกติออกจากข้อมูลของฉันหรือไม่ สำหรับ NS ส่วนใหญ่ ถ้า ข้อมูลของคุณ ได้รับผลกระทบจากกรณีรุนแรงเหล่านี้ คุณ สามารถ ผูกพัน NS ป้อนข้อมูลให้กับตัวแทนทางประวัติศาสตร์ของ ข้อมูลของคุณ ที่ไม่รวม ค่าผิดปกติ . พิจารณาเป็นกรณีๆ ไป อะไร NS ผลกระทบของ ค่าผิดปกติ เคยเป็น. จากนั้นตัดสินใจว่าคุณต้องการ ลบ , เปลี่ยนหรือเก็บ theoutlier ค่า

ในแง่นี้ การวิเคราะห์ข้อมูลจัดการกับค่าผิดปกติอย่างไร

นี่คือสี่แนวทาง:

  1. ทิ้งบันทึกค่าผิดปกติ ในกรณีของ Bill Gates หรือค่าผิดปกติอื่น บางครั้งก็เป็นการดีที่สุดที่จะลบบันทึกนั้นออกจากชุดข้อมูลของคุณทั้งหมด เพื่อไม่ให้บุคคลหรือเหตุการณ์นั้นบิดเบือนการวิเคราะห์ของคุณ
  2. ปิดข้อมูลค่าผิดปกติของคุณ
  3. กำหนดค่าใหม่
  4. ลองแปลงร่าง.

ตัวอย่างของค่าผิดปกติคืออะไร?

Outlier . more ค่าที่ "อยู่ภายนอก" (น้อยกว่าหรือใหญ่กว่า) ค่าอื่นๆ ส่วนใหญ่ในชุดข้อมูล สำหรับ ตัวอย่าง ในคะแนน 25, 29, 3, 32, 85, 33, 27, 28 ทั้ง3 และ 85 คือ " ค่าผิดปกติ ".