สารบัญ:

ค่าผิดปกติหลายตัวแปรคืออะไร?
ค่าผิดปกติหลายตัวแปรคืออะไร?

วีดีโอ: ค่าผิดปกติหลายตัวแปรคืออะไร?

วีดีโอ: ค่าผิดปกติหลายตัวแปรคืออะไร?
วีดีโอ: R 07_ค่าผิดปกติ หรือ Outlier case 2024, พฤศจิกายน
Anonim

NS ค่าผิดปกติหลายตัวแปร คือการรวมกันของคะแนนที่ผิดปกติอย่างน้อยสองตัวแปร ทั้งสองประเภท ค่าผิดปกติ สามารถมีอิทธิพลต่อผลลัพธ์ของการวิเคราะห์ทางสถิติ ค่าผิดปกติ มีอยู่ด้วยเหตุสี่ประการ การป้อนข้อมูลที่ไม่ถูกต้องอาจทำให้ข้อมูลมีกรณีที่รุนแรง

ในทำนองเดียวกัน มีคนถามว่าคุณจะระบุค่าผิดปกติแบบสองตัวแปรได้อย่างไร

หนึ่ง วิธีตรวจสอบ ถ้าสิ่งเหล่านี้เป็นเช่นนี้ " ค่าผิดปกติ bivariate " คือการตรวจสอบส่วนที่เหลือของคดีในการวิเคราะห์ การทำเช่นนี้ เราได้รับ สองตัวแปร สูตรการถดถอย ใช้กลับไปที่แต่ละกรณีที่ได้รับ y' แล้วคำนวณส่วนที่เหลือเป็น y-y' อันที่จริง SPSS จะทำสิ่งนี้ให้เราภายในรันการถดถอย

อาจมีคนถามว่า Multivariate กับ univariate ต่างกันอย่างไร? ตัวแปร และ หลายตัวแปร แสดงถึงสองวิธีในการวิเคราะห์ทางสถิติ ตัวแปร เกี่ยวข้องกับการวิเคราะห์ตัวแปรเดียวในขณะที่ หลายตัวแปร การวิเคราะห์ตรวจสอบตัวแปรตั้งแต่สองตัวขึ้นไป ที่สุด หลายตัวแปร การวิเคราะห์เกี่ยวข้องกับตัวแปรตามและตัวแปรอิสระหลายตัว

เมื่อคำนึงถึงสิ่งนี้ ค่าผิดปกติประเภทต่าง ๆ มีอะไรบ้าง

ค่าผิดปกติสามประเภทที่แตกต่างกัน

  • ประเภทที่ 1: Global Outliers (เรียกอีกอย่างว่า “Point Anomalies”):
  • ความผิดปกติทั่วโลก:
  • ประเภท 2: ค่าผิดปกติตามบริบท (เงื่อนไข):
  • ความผิดปกติตามบริบท: ค่าไม่ได้อยู่นอกช่วงส่วนกลางปกติ แต่จะผิดปกติเมื่อเทียบกับรูปแบบตามฤดูกาล
  • ประเภท 3: ค่าผิดปกติโดยรวม:

คุณจะระบุค่าผิดปกติหลายตัวแปรได้อย่างไร

ค่าผิดปกติหลายตัวแปร สามารถระบุได้ด้วยการใช้ระยะทาง Mahalanobis ซึ่งเป็นระยะห่างของจุดข้อมูลจากจุดศูนย์กลางที่คำนวณได้ของกรณีอื่นที่จุดศูนย์กลางถูกคำนวณเป็นจุดตัดของค่าเฉลี่ยของตัวแปรที่กำลังประเมิน