Hướng dẫn cài đặt hadoop vafthuwcj hiện lệnh năm 2024
Hadoop là công nghệ phần mềm được thiết kế để lưu trữ và xử lý khối lượng dữ liệu lớn phân tán theo cụm máy chủ và cụm lưu trữ đại trà. Hồi những năm 2000, Google công bố tài liệu nghiên cứu cách tiếp cận và nguyên tắc thiết kế để xử lý khối lượng lớn dữ liệu đã được đánh chỉ mục trên web. Những tài liệu này đã ảnh hưởng đến sự phát triển của Hadoop. Ba trong số những nguyên tắc cơ bản thiết kế là: Show
Hadoop framework gồm 4 module:
2. Cài đặt Hadoop 2.7.0 single node cluster2.1. Cài đặt các dependencies
-- Tiếp tục thêm những dòng dưới đây vào file sshd_config:
-- Tiếp tục thay đổi LogLevel INFO thành Loglevel VERBOSE tại file sshd_config:-- Cuối cùng save và restart lại SSH Server bằng câu lệnh dưới đây:
Sau khi máy chủ SSH được cấu hình, một khoá SSH cho người dùng
9 được tạo ra bằng cách chạy lệnh dưới đây.
Họ tạo ra một cặp khóa RSA mà không có mật khẩu. Một mật khẩu sẽ được yêu cầu mỗi lần hadoop tương tác với node nên để chúng ta có thể tiết kiệm cho bản thân mình những nhắc nhở cho một mật khẩu mỗi lần -- Sau khi key được tạo, bạn có thể sử dụng nó để kích hoạt truy cập SSH vào máy local bằng cách chạy lệnh dưới đây:
0 -- Test localhost:
1 2.2. Cài Apache Hadoop 2.7.0
2
-- Như hình dưới đây: -- Save file -- Lưu thay đổi trên trong file .bashrc với câu lệnh
3
-- Thư mục
4 chứa các file cấu hình. Mở
5 trong trình soạn thảo văn bản và đặt biến
6 bằng cách thêm dòng dưới đây. Điều này quy định java sẽ được sử dụng bởi Hadoop
6 -- Thêm dòng dưới đây:
7 -- Save file
5
Tạo một thư mục hoạt động như là thư mục cơ sở cho các thư mục tạm thời khác và gán nó cho người dùng
9 bằng cách chạy các lệnh dưới đây: |