Spark สามารถอ่านไฟล์ในเครื่องได้หรือไม่?
Spark สามารถอ่านไฟล์ในเครื่องได้หรือไม่?

วีดีโอ: Spark สามารถอ่านไฟล์ในเครื่องได้หรือไม่?

วีดีโอ: Spark สามารถอ่านไฟล์ในเครื่องได้หรือไม่?
วีดีโอ: สปาร์ค115i ไฟโค้ดติดถี่ๆรัวๆเกิดจากอะไร 2024, อาจ
Anonim

ในขณะที่ Spark รองรับการโหลด ไฟล์ จาก ท้องถิ่น ระบบไฟล์ มันต้องการให้ ไฟล์ มีอยู่ในเส้นทางเดียวกันบนโหนดทั้งหมดในคลัสเตอร์ของคุณ ระบบไฟล์เครือข่ายบางระบบ เช่น NFS, AFS และเลเยอร์ NFS ของ MapR ถูกเปิดเผยต่อผู้ใช้ในฐานะระบบไฟล์ปกติ

ต่อมาอาจมีคนถามว่าฉันจะเรียกใช้ spark ในโหมดท้องถิ่นได้อย่างไร

ใน โหมดท้องถิ่น , จุดประกาย งาน วิ่ง บนเครื่องเดียว และดำเนินการพร้อมกันโดยใช้มัลติเธรด: สิ่งนี้จะจำกัดการขนาน (อย่างมากที่สุด) ของจำนวนคอร์ในเครื่องของคุณ ถึง วิ่ง งานใน โหมดท้องถิ่น คุณต้องจองเครื่องผ่าน SLURM แบบโต้ตอบก่อน โหมด และเข้าสู่ระบบ

ด้านบนนี้ SC textFile คืออะไร? textFile เป็นวิธีการขององค์กร อาปาเช่ SparkContext ชั้นเรียนที่อ่านว่า a ไฟล์ข้อความ จาก HDFS ระบบไฟล์ในเครื่อง (พร้อมใช้งานบนโหนดทั้งหมด) หรือ URI ระบบไฟล์ที่รองรับ Hadoop และส่งคืนเป็น RDD ของสตริง

ในเรื่องนี้ไฟล์ spark คืออะไร?

NS ไฟล์ Spark เป็นเอกสารที่คุณเก็บความดีความคิดสร้างสรรค์ของคุณไว้ มันถูกกำหนดโดยผู้เขียนสตีเฟ่นจอห์นสัน ดังนั้น แทนที่จะขีดเขียนโน้ตบน Post-it® กลางดึกหรือจดบันทึกความคิดต่าง ๆ คุณรวมแนวคิดทั้งหมดของคุณไว้ในที่เดียว ไฟล์.

จุดประกายการรวบรวมแบบขนานคืออะไร?

เราอธิบายการดำเนินการกับชุดข้อมูลแบบกระจายในภายหลัง คอลเลกชันคู่ขนาน ถูกสร้างขึ้นโดยการเรียก JavaSparkContext 's ขนานกัน วิธีการที่มีอยู่ ของสะสม ในโปรแกรมไดรเวอร์ของคุณ องค์ประกอบของ ของสะสม ถูกคัดลอกเพื่อสร้างชุดข้อมูลแบบกระจายที่สามารถดำเนินการแบบคู่ขนานได้

แนะนำ: