DistCp ใน Hadoop คืออะไร?
DistCp ใน Hadoop คืออะไร?

วีดีโอ: DistCp ใน Hadoop คืออะไร?

วีดีโอ: DistCp ใน Hadoop คืออะไร?
วีดีโอ: Hadoop In 5 Minutes | What Is Hadoop? | Introduction To Hadoop | Hadoop Explained |Simplilearn 2024, อาจ
Anonim

DistCp (สำเนาแบบกระจาย) เป็นเครื่องมือที่ใช้สำหรับการคัดลอกระหว่าง/ภายในคลัสเตอร์ขนาดใหญ่ มันใช้ แผนที่ลด เพื่อส่งผลต่อการกระจาย การจัดการข้อผิดพลาดและการกู้คืน และการรายงาน มันขยายรายการไฟล์และไดเร็กทอรีเป็นอินพุตเพื่อแมปงาน ซึ่งแต่ละรายการจะคัดลอกพาร์ติชั่นของไฟล์ที่ระบุในรายการต้นทาง

ในทำนองเดียวกันอาจมีคนถามว่า Distcp เขียนทับหรือไม่

ฉันควรจะอธิบายเพิ่มเติมและอธิบายว่า distcp - เขียนทับ จะ เขียนทับ ไฟล์ไม่ว่าขนาดจะตรงกันหรือไม่ก็ตาม การดำเนินการนี้จะอัปเดตไฟล์ทั้งหมดใน hdfs-nn2 ที่ไม่ตรงกับขนาดจาก hdfs-nn1 รวมถึงลบไฟล์ที่ไม่เกี่ยวข้องด้วย

คำสั่ง Hadoop FS คืออะไร ระบบไฟล์ ( FS ) เชลล์รวมถึงเชลล์เหมือนต่างๆ คำสั่ง ที่โต้ตอบโดยตรงกับ Hadoop ระบบไฟล์แบบกระจาย ( HDFS ) ตลอดจนระบบไฟล์อื่นๆ ที่ Hadoop รองรับเช่น Local FS , HFTP FS , S3 FS , และคนอื่น ๆ.

ด้วยวิธีนี้ ฉันจะถ่ายโอนข้อมูลจาก Hdf หนึ่งไปยัง Hdf อื่นได้อย่างไร

Hadoop fs cp – ง่ายที่สุด วิธีการคัดลอกข้อมูลจากหนึ่ง ไดเรกทอรีต้นทางถึง อื่น . ใช้ hadoop fs -cp [แหล่งที่มา] [ปลายทาง] Hadoop fs copyFromLocal – ต้อง คัดลอกข้อมูล จากระบบไฟล์ในเครื่องเป็น HDFS ? ใช้ hadoop fs -copyFromLocal [แหล่งที่มา] [ปลายทาง]

ฉันจะคัดลอกคลัสเตอร์จากคลัสเตอร์หนึ่งไปยังอีกคลัสเตอร์หนึ่งได้อย่างไร

กำลังคัดลอกไฟล์ ระหว่าง กลุ่ม . คุณสามารถ คัดลอกไฟล์ หรือไดเร็กทอรีระหว่าง different กลุ่ม โดยใช้คำสั่ง hadoop distcp คุณต้องใส่ข้อมูลประจำตัว ไฟล์ ในของคุณ สำเนา ขอแหล่งที่มา กลุ่ม สามารถตรวจสอบว่าคุณได้รับการตรวจสอบสิทธิ์กับแหล่งที่มา กลุ่ม และเป้าหมาย กลุ่ม.

แนะนำ: