ฉันจะลบค่าที่หายไปใน R ได้อย่างไร
ฉันจะลบค่าที่หายไปใน R ได้อย่างไร

วีดีโอ: ฉันจะลบค่าที่หายไปใน R ได้อย่างไร

วีดีโอ: ฉันจะลบค่าที่หายไปใน R ได้อย่างไร
วีดีโอ: พอ - Atom ชนกันต์ [Official MV] 2024, พฤศจิกายน
Anonim

อันดับแรก ถ้าเราต้องการแยกออก ค่าที่หายไป จากการดำเนินการทางคณิตศาสตร์ใช้ นา . rm = อาร์กิวเมนต์ TRUE หากคุณไม่ยกเว้นสิ่งเหล่านี้ ค่า ฟังก์ชันส่วนใหญ่จะส่งคืน an NA . เราอาจปรารถนาที่จะสับเซตของเรา ข้อมูล เพื่อให้ได้ข้อสังเกตที่สมบูรณ์ การสังเกตเหล่านั้น (แถว) ในของเรา ข้อมูล ที่มีไม่ ข้อมูลที่ขาดหายไป.

พูดง่ายๆ ก็คือ R จะจัดการกับค่าที่หายไปได้อย่างไร

ใน NS NS ค่าที่หายไป ถูกเข้ารหัสด้วยสัญลักษณ์ NA . เพื่อระบุรายการที่ขาดหายไปในชุดข้อมูลของคุณ ฟังก์ชันคือ นา (). เมื่อคุณนำเข้าชุดข้อมูลจากแอปพลิเคชันทางสถิติอื่นๆ ค่าที่หายไป อาจมีการเข้ารหัสด้วยตัวเลข เช่น 99 เพื่อให้ NS รู้ว่านั่นคือ ไม่มีค่า คุณต้องเข้ารหัสใหม่

นอกจากนี้ คุณจะใส่ค่าที่ขาดหายไปใน R ได้อย่างไร การจัดการกับข้อมูลที่ขาดหายไปโดยใช้ R

  1. colsum(is.na(ดาต้าเฟรม))
  2. sum(is.na(data frame$ชื่อคอลัมน์)
  3. ค่าที่หายไปสามารถรักษาได้โดยใช้วิธีการดังต่อไปนี้:
  4. ค่าเฉลี่ย/ โหมด/ การใส่ค่ามัธยฐาน: การใส่แทนเป็นวิธีการเติมค่าที่ขาดหายไปด้วยค่าโดยประมาณ
  5. โมเดลการคาดการณ์: โมเดลการคาดการณ์เป็นหนึ่งในวิธีการที่ซับซ้อนในการจัดการข้อมูลที่ขาดหายไป

ต่อมาอาจมีคนถามว่าฉันจะลบแถวที่มีค่า NA ใน R ได้อย่างไร

ฟังก์ชัน omit() ส่งคืนรายการโดยไม่มีใดๆ แถว นั่น มีค่า na . ส่ง data frame ของคุณผ่าน the นา . ฟังก์ชัน omit() เป็นวิธีง่ายๆ ในการล้างข้อมูลบันทึกที่ไม่สมบูรณ์ออกจากการวิเคราะห์ของคุณ มีประสิทธิภาพ วิธีลบค่า na ใน r.

ฉันจะลบค่าผิดปกติออกจากชุดข้อมูลใน R ได้อย่างไร

ไม่มีเฉพาะเจาะจง NS ทำหน้าที่ ลบค่าผิดปกติ . ก่อนอื่นคุณจะต้องค้นหาว่าข้อสังเกตคืออะไร ค่าผิดปกติ แล้วก็ ลบ พวกเขา นั่นคือ การหาควอร์ไทล์ที่หนึ่งและสาม (บานพับ) และพิสัยระหว่างควอไทล์เพื่อกำหนดตัวเลขของรั้วด้านใน

แนะนำ: