我有文件存储在HDFS上,我需要得到它的大小。我在命令提示符处使用以下行来获取文件大小
hadoop fs -du -s train.csv | awk’{{s + = $ 1}}结束{{printf s}}
我知道 …
从Hadoop文档:
du返回三列,格式如下: size disk_space_consumed_with_all_replicas full_path_name https://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/FileSystemShell.html
正如您所看到的,第一列是文件大小,而第二列是消耗的空间,包括副本。