HDFS命令行操作
HDFS(Hadoop Distributed File System)是Hadoop生态系统中的分布式文件系统,设计用于存储大规模数据集并提供高吞吐量的数据访问。HDFS命令行工具是管理HDFS文件系统的主要方式之一,它允许用户通过简单的命令来执行文件操作。
介绍
HDFS命令行工具提供了类似于Linux文件系统的操作命令,如ls
、mkdir
、put
、get
等。通过这些命令,用户可以方便地在HDFS上进行文件管理。本文将逐步介绍如何使用这些命令,并通过实际案例展示其应用场景。
基本命令
1. 查看HDFS文件列表
使用hdfs dfs -ls
命令可以查看HDFS中的文件和目录列表。
hdfs dfs -ls /user/hadoop
输出示例:
Found 2 items
drwxr-xr-x - hadoop supergroup 0 2023-10-01 12:34 /user/hadoop/dir1
-rw-r--r-- 1 hadoop supergroup 1024 2023-10-01 12:35 /user/hadoop/file1.txt
2. 创建目录
使用hdfs dfs -mkdir
命令可以在HDFS中创建目录。
hdfs dfs -mkdir /user/hadoop/newdir
3. 上传文件到HDFS
使用hdfs dfs -put
命令可以将本地文件上传到HDFS。
hdfs dfs -put localfile.txt /user/hadoop/newdir/
4. 下载文件到本地
使用hdfs dfs -get
命令可以将HDFS中的文件下载到本地。
hdfs dfs -get /user/hadoop/newdir/localfile.txt ./localfile_downloaded.txt