hdfs_import ()

阅读(55) 标签: hive数据库, orc, parquet,

描述:

读取orcparquet格式数据。

语法:

f.hdfs_import([col,…])

备注:

外部库函数,外部库的使用请参考《外部库使用指南》。

读取本地或hdfs中的orcparquet格式数据。

参数:

f

本地或hdfsorc/parquet格式的文件对象。

col

读出的字段,缺省返回表中所有字段。

选项:

@c

返回游标。

@p

读取parquet格式,缺省读取orc格式。

返回值:

序表

示例:

 

A

 

1

=file("F:/tmp/mytest.orc")

打开本地orc格式数据文件。

2

=A1.hdfs_import()

读取orc文件,返回所有字段。

3

=A1.hdfs_import@c()

返回游标。

4

=file("hdfs://localhost:9000/user/hive/warehouse/test1.orc")

打开hdfsorc格式数据文件。

5

=A4.hdfs_import("product","store")

读取指定字段。

6

=hive_open("hdfs://localhost:9000","thrift://localhost:9083","hive","asus")

连接hive数据库。

7

=hive_table@p(A6)

查询所有parquet类型的表。

8

=A7.select(tableName=="myParquet")

选中表myParquet

9

=file(A8.location)

加载hdfs文件。

10

=A9.hdfs_import@p()

读取表中的数据。

11

=hive_close(A6)