程式扎記: [ Big Data 研究 ] 06 設定與初始化 HDFS 分散式檔案系統 - Part2

標籤

2015年9月9日 星期三

[ Big Data 研究 ] 06 設定與初始化 HDFS 分散式檔案系統 - Part2

HDFS 分散式檔案系統指令 
Hadoop 官方目前提供 HDFS 系統操作指令中, 分別有 "hdfs dfs" 和 "hadoop fs" 兩種操作指令, 功能相同. 後續將使用前者當作範例說明. 

建立目錄與查看目錄 
首先請登入 nn 運算主機啟動 HDFS 檔案系統服務: 
# lxc-console -n nn // 在實體主機利用 Console 登入 nn 虛擬主機
ubuntu@nn:~$ start-dfs.sh // 啟動 HDFS 服務

接著來建立目錄與查看建立的目錄: 
ubuntu@nn:~$ hdfs dfs -mkdir /test // 使用命令 mkdir 建立目錄 test
ubuntu@nn:~$ hdfs dfs -ls / // 檢查剛剛建立的目錄
Found 1 items
drwxr-xr-x - ubuntu supergroup 0 2015-09-09 05:59 /test

上載檔案 
接著使用 HDFS 系統的 '-copyFromLocal' 指令, 將所有開頭為 ".bashrc" 的檔案上傳到 "/test" 目錄中: 
ubuntu@nn:~$ hdfs dfs -copyFromLocal .bash* /test
ubuntu@nn:~$ hdfs dfs -ls /test
Found 3 items
-rw-r--r-- 2 ubuntu supergroup 1616 2015-09-09 06:06 /test/.bash_history
-rw-r--r-- 2 ubuntu supergroup 220 2015-09-09 06:06 /test/.bash_logout
-rw-r--r-- 2 ubuntu supergroup 3843 2015-09-09 06:06 /test/.bashrc

顯示檔案內容 
可以使用 "-cat" 指令查看檔案內容: 
ubuntu@nn:~$ hdfs dfs -cat /test/.bashrc | head -n 5
# ~/.bashrc: executed by bash(1) for non-login shells.
# see /usr/share/doc/bash/examples/startup-files (in the package bash-doc)
# for examples

# If not running interactively, don't do anything

取回 HDFS 檔案系統中的檔案 
可以使用命令 "-get" 指令取回 HDFS 檔案系統中的檔案回到本地端主機: 
ubuntu@nn:~$ hdfs dfs -get /test/.bashrc /tmp/test.txt
ubuntu@nn:~$ cat /tmp/test.txt | head -n 5
# ~/.bashrc: executed by bash(1) for non-login shells.
# see /usr/share/doc/bash/examples/startup-files (in the package bash-doc)
# for examples

# If not running interactively, don't do anything

刪除檔案 
可以使用命令 "-rm" 來刪除檔案; "-rmdir" 來刪除目錄; 或是 "-rmr" (或是 -rm -r) 來 recursive 刪除檔案. 
ubuntu@nn:~$ hdfs dfs -rm /test/.bashrc // 刪除檔案 /test/.bashrc
15/09/09 06:13:56 INFO fs.TrashPolicyDefault: Namenode trash configuration: Deletion interval = 0 minutes, Emptier interval = 0 minutes.
Deleted /test/.bashrc

ubuntu@nn:~$ hdfs dfs -rm -r /test // 刪除目錄 /test 以及裡面的所有檔案
15/09/09 06:17:58 INFO fs.TrashPolicyDefault: Namenode trash configuration: Deletion interval = 0 minutes, Emptier interval = 0 minutes.
Deleted /test

Supplement 
[ Big Data 研究 ] 06 設定與初始化 HDFS 分散式檔案系統 - Part1 
[ Big Data 研究 ] 06 設定與初始化 HDFS 分散式檔案系統 - Part2 
[ 深入雲計算 ] HDFS : 開源的 GFS - HDFS 基礎概念與常用命令

沒有留言:

張貼留言

網誌存檔