สารบัญ:

คุณจัดการกับค่า NA ใน R อย่างไร?
คุณจัดการกับค่า NA ใน R อย่างไร?

วีดีโอ: คุณจัดการกับค่า NA ใน R อย่างไร?

วีดีโอ: คุณจัดการกับค่า NA ใน R อย่างไร?
วีดีโอ: Understanding missing data and missing values. 5 ways to deal with missing data using R programming 2024, พฤศจิกายน
Anonim

เมื่อคุณนำเข้าชุดข้อมูลจากแอปพลิเคชันทางสถิติอื่นๆ ค่าที่หายไป อาจมีการเข้ารหัสด้วยตัวเลข เช่น 99 เพื่อให้ NS รู้ว่านั่นคือ ไม่มีค่า คุณต้องเข้ารหัสใหม่ อีกหนึ่งฟังก์ชันที่มีประโยชน์ใน NS ถึง จัดการกับค่าที่หายไป เป็น นา . ละเว้น () ซึ่งลบการสังเกตที่ไม่สมบูรณ์

คุณจัดการกับ NA ใน R อย่างไร?

ตัวเลือก NA ใน R

  1. ละเว้นและนา ไม่รวม: ส่งคืนอ็อบเจ็กต์ที่มีการลบการสังเกตออก หากมีค่าที่ขาดหายไป ความแตกต่างระหว่างการละเว้นและการยกเว้น NA สามารถเห็นได้ในการคาดการณ์และฟังก์ชันที่เหลือ
  2. ผ่าน: ส่งกลับวัตถุที่ไม่เปลี่ยนแปลง
  3. ล้มเหลว: ส่งกลับวัตถุก็ต่อเมื่อไม่มีค่าที่ขาดหายไป

ในทำนองเดียวกัน คุณจะจัดการกับข้อมูลที่ขาดหายไปใน R ได้อย่างไร? มีหลายวิธีในการจัดการกับค่าที่ขาดหายไปของวิธีที่เด็ดขาด

  1. ละเว้นการสังเกตของค่าที่หายไปหากเรากำลังจัดการกับชุดข้อมูลขนาดใหญ่และจำนวนเร็กคอร์ดที่หายไปมีค่าน้อยลง
  2. ละเว้นตัวแปรถ้าไม่สำคัญ
  3. พัฒนาแบบจำลองเพื่อทำนายค่าที่หายไป
  4. ถือว่าข้อมูลที่ขาดหายไปเป็นเพียงหมวดหมู่อื่น

ในทำนองเดียวกันอาจมีคนถามว่าคุณจะตั้งค่าที่ขาดหายไปใน R ได้อย่างไร?

ใน NS , ค่าที่หายไป ถูกแทนด้วยสัญลักษณ์ NA (ไม่พร้อมใช้งาน). เป็นไปไม่ได้ ค่า (เช่น การหารด้วยศูนย์) จะแสดงด้วยสัญลักษณ์ NaN (ไม่ใช่ตัวเลข) ต่างจาก SAS NS ใช้สัญลักษณ์เดียวกันสำหรับอักขระและตัวเลข ข้อมูล . เพื่อฝึกฝนการทำงานเพิ่มเติมกับ ข้อมูลที่ขาดหายไป , ลองคอร์สทำความสะอาดนี้ ข้อมูลใน R.

Na Rm หมายถึงอะไรในภาษา R?

เมื่อใช้ฟังก์ชันดาต้าเฟรม นา . rm ใน NS หมายถึงพารามิเตอร์ทางลอจิคัลที่บอกฟังก์ชันว่าจะลบหรือไม่ NA ค่าจากการคำนวณ มันอย่างแท้จริง แปลว่า น ลบ. ไม่ใช่ฟังก์ชันหรือการดำเนินการ มันเป็นเพียงพารามิเตอร์ที่ใช้โดยฟังก์ชัน dataframe หลายตัว

แนะนำ: