Impala คืออะไรในข้อมูลขนาดใหญ่?

👤 ผู้เขียน Lynn Donovan 📧 donovan@answers-technology.com.
⏱ Public 2023-12-15 23:54.
🖍 แก้ไขล่าสุด 2025-01-22 17:43.

อิมพาลา เป็นโอเพ่นซอร์สเอ็นจิ้นการประมวลผลแบบขนานขนาดใหญ่บนระบบคลัสเตอร์เช่น Apache Hadoop มันถูกสร้างขึ้นจากกระดาษ Dremel ของ Google เป็น SQL แบบโต้ตอบเช่นเอ็นจิ้นการสืบค้นที่ทำงานบน Hadoop Distributed File System (HDFS) อิมพาลา ใช้ HDFS เป็นที่เก็บข้อมูลพื้นฐาน

เกี่ยวกับเรื่องนี้ Impala และรังผึ้งคืออะไร?

Apache ไฮฟ์ เป็นมาตรฐานที่มีประสิทธิภาพสำหรับ SQL-in-Hadoop อิมพาลา เป็นเอ็นจิ้นการสืบค้น SQL โอเพ่นซอร์สที่พัฒนาขึ้นหลังจาก Google Dremel Cloudera อิมพาลา เป็นเอ็นจิ้น SQL สำหรับประมวลผลข้อมูลที่จัดเก็บไว้ใน HBase และ HDFS อิมพาลา ใช้ ไฮฟ์ megastore และสามารถสอบถาม ไฮฟ์ ตารางโดยตรง

นอกจากนี้ รังใดดีกว่ารังหรืออิมพาลา? Apache ไฮฟ์ อาจไม่เหมาะสำหรับการคำนวณเชิงโต้ตอบในขณะที่ อิมพาลา มีไว้สำหรับการคำนวณเชิงโต้ตอบ ไฮฟ์ เป็น Hadoop MapReduce แบบแบตช์ในขณะที่ อิมพาลา เป็น มากกว่า เช่นฐานข้อมูล MPP ไฮฟ์ รองรับประเภทที่ซับซ้อนแต่ อิมพาลา ไม่. Apache ไฮฟ์ ทนต่อความผิดพลาดในขณะที่ อิมพาลา ไม่รองรับความทนทานต่อความผิดพลาด

ยังถามอีกว่า ทำไมเราใช้อิมพาลา?

อิมพาลา รองรับการประมวลผลข้อมูลในหน่วยความจำ เช่น เข้าถึง/วิเคราะห์ข้อมูลที่ เป็น เก็บไว้ในโหนดข้อมูล Hadoop โดยไม่มีการย้ายข้อมูล คุณสามารถ เข้าถึงข้อมูล ใช้อิมพาลาโดยใช้ แบบสอบถามที่เหมือน SQL อิมพาลา ให้การเข้าถึงข้อมูลใน HDFS ได้เร็วขึ้นเมื่อเปรียบเทียบกับเอ็นจิ้น SQL อื่น ๆ

กลุ่มข้อมูลขนาดใหญ่คืออะไร?

Apache ไฮฟ์ คือ ข้อมูล ระบบคลังสินค้าสำหรับ ข้อมูล สรุปและวิเคราะห์และสำหรับคำถามขนาดใหญ่ ข้อมูล ระบบในแพลตฟอร์มโอเพ่นซอร์ส Hadoop มันแปลงการสืบค้นที่เหมือน SQL เป็นงาน MapReduce เพื่อการดำเนินการและการประมวลผลที่ง่ายดายของ.ปริมาณมาก ข้อมูล.