描述:
读取orc、parquet格式数据。
语法:
f.hdfs_import([col,…])
备注:
外部库函数,外部库的使用请参考《外部库使用指南》。
读取本地或hdfs中的orc、parquet格式数据。
参数:
f |
本地或hdfs中orc/parquet格式的文件对象。 |
col |
读出的字段,缺省返回表中所有字段。 |
选项:
@c |
返回游标。 |
@p |
读取parquet格式,缺省读取orc格式。 |
返回值:
序表
示例:
|
|
|
|
=file("F:/tmp/mytest.orc") |
打开本地orc格式数据文件。 |
|
=A1.hdfs_import() |
读取orc文件,返回所有字段。 |
|
=A1.hdfs_import@c() |
返回游标。 |
|
|
打开hdfs上orc格式数据文件。 |
|
|
读取指定字段。 |
|
=hive_open("hdfs://localhost:9000","thrift://localhost:9083","hive","asus") |
连接hive数据库。 |
|
=hive_table@p(A6) |
查询所有parquet类型的表。 |
|
=A7.select(tableName=="myParquet") |
选中表myParquet。 |
|
=file(A8.location) |
加载hdfs文件。 |
|
=A9.hdfs_import@p() |
读取表中的数据。 |
|
|
|