如何为嵌套目录结构定义分区外部表

作者: 关于贤的记忆
发布时间: 2025-01-29 10:48:58 (24天前)
转自：

2 条回复

0#
回复此人
滔滔江水 | 2019-08-31 10-32

<div class =“post-text”itemprop =“text”> <P> 除了标题之外，表定义看起来很好。如果您没有跳过标题，那么标题行将在数据集中返回，如果某些列不是字符串，则标题值将被选为 <code> NULL </code> 秒。要跳过被选中的标题，请在表DDL的末尾添加此标题 <code> tblproperties("skip.header.line.count"="1") </code> - 仅在Hive中支持此属性，请阅读此解决方法： <a href="https://stackoverflow.com/a/54542483/2700344"> https://stackoverflow.com/a/54542483/2700344 </A> </p> <P> 除了创建表之外，还需要创建分区。 </p> <P> 使用 <code> MSCK [REPAIR] TABLE Air; </code> 命令。 </p> <P> Amazon Elastic MapReduce（EMR）的Hive版本上的等效命令是： <code> ALTER TABLE Air RECOVER PARTITIONS </code> 。 </p> <P> 这将添加Hive分区元数据。见这里的手册： <a href="https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-RecoverPartitions(MSCKREPAIRTABLE)" rel="nofollow noreferrer"> 的<strong> 恢复分区 </强> </A> </p> </DIV>

编辑

登录后才能参与评论