Spark ใช้ผู้ดูแลสวนสัตว์หรือไม่?
Spark ใช้ผู้ดูแลสวนสัตว์หรือไม่?

วีดีโอ: Spark ใช้ผู้ดูแลสวนสัตว์หรือไม่?

วีดีโอ: Spark ใช้ผู้ดูแลสวนสัตว์หรือไม่?
วีดีโอ: จิตใจของราชสีห์ 2024, ธันวาคม
Anonim

เริ่ม Spark ควบคุมหลายโหนดและตรวจดูให้แน่ใจว่าโหนดเหล่านี้มีเหมือนกัน ผู้ดูแลสวนสัตว์ การกำหนดค่าสำหรับ ZooKeeper URL และไดเรกทอรี

ข้อมูล.

คุณสมบัติของระบบ ความหมาย
จุดประกาย .ปรับใช้. ผู้ดูแลสวนสัตว์ .dir ไดเร็กทอรีใน ZooKeeper เพื่อจัดเก็บสถานะการกู้คืน (ค่าเริ่มต้น: / จุดประกาย ). สามารถเลือกได้

คุณสามารถเรียกใช้ Spark ในพื้นที่ได้หรือไม่?

หัวเทียน เป็น วิ่ง โดยใช้ตัวกำหนดเวลาคลัสเตอร์แบบสแตนด์อโลนในตัวใน ท้องถิ่น โหมด. ซึ่งหมายความว่า. ทั้งหมด Spark กระบวนการคือ วิ่ง ภายใน JVM เดียวกันอย่างมีประสิทธิภาพ อินสแตนซ์เดียวแบบมัลติเธรดของ Spark.

ประการที่สอง Spark สามารถใช้โดยไม่มี Hadoop ได้หรือไม่? ตามที่ Spark เอกสาร, หัวเทียน วิ่ง ไม่มี Hadoop . คุณสามารถเรียกใช้เป็นโหมดสแตนด์อโลน ปราศจาก ผู้จัดการทรัพยากรใด ๆ แต่ถ้าคุณต้องการทำงานในการตั้งค่าแบบหลายโหนด คุณต้องมีตัวจัดการทรัพยากร เช่น YARN หรือ Mesos และระบบไฟล์แบบกระจาย เช่น HDFS , S3 เป็นต้น ใช่ หัวเทียน วิ่ง ไร้ฮาดูป.

สิ่งที่ควรทราบก็คือ เหตุใด ZooKeeper จึงถูกใช้ใน Hadoop

ผู้ดูแลสวนสัตว์ ใน Hadoop สามารถดูได้ว่าเป็นพื้นที่เก็บข้อมูลแบบรวมศูนย์ซึ่งแอปพลิเคชันแบบกระจายสามารถใส่ข้อมูลและรับข้อมูลได้ มันคือ ใช้แล้ว เพื่อให้ระบบแบบกระจายทำงานประสานกันเป็นหน่วยเดียว โดยใช้เป้าหมายการซิงโครไนซ์ การซีเรียลไลซ์เซชัน และการประสานงาน

spark แบบสแตนด์อโลนทำงานอย่างไร

สแตนด์อโลน โหมดเป็นตัวจัดการคลัสเตอร์อย่างง่ายที่รวมเข้ากับ Spark . ทำให้ง่ายต่อการติดตั้งคลัสเตอร์ที่ Spark ตัวมันเองจัดการและสามารถทำงานบน Linux, Windows หรือ Mac OSX มักจะเป็นวิธีที่ง่ายที่สุดในการวิ่ง Spark แอปพลิเคชันในสภาพแวดล้อมแบบคลัสเตอร์ เรียนรู้วิธีการติดตั้ง Apache Spark บน สแตนด์อโลน โหมด.

แนะนำ: