htmlparse ()

阅读(2487) 标签: html, 标签, 数据文本,

描述:

获取html文件中指定标签的具体数据文本。

语法:

s.htmlparse(tag:i:j,)

备注:

获取html文件s中第itag下的第j个文本。

j省略取出第itag的第1个文本, i省略取出所有tag的所有文本,无参数时取出所有文本。

参数:

s

html文件的内容。

tag

html中的标签;tagtable时,会获取整个table标签的数据。

i/j

整数。

选项:

@0

保留null值,选项缺省会去掉null值。

@p

解析文本为相应类型的数值。

返回值:

序列

示例:

 

A

 

1

=file("D:/test.html").read()

读取html中的内容。

2

=A1.htmlparse("a":11:0)

获取A1中第12<a>标签下的第1个文本。

3

=A1.htmlparse("a":11:0,"span":8:0)

获取HTML中多个tag下的文本。

4

=A1.htmlparse("table":7)

获取第8<table>标签下的所有内容。

 

 

A

 

1

=file("rq.html").read()

读取html中的内容,返回结果如下:

2

=A1.htmlparse("p":5)

获取A1中第5<p>标签下的第1个文本:

3

=A1.htmlparse("p")

获取A1中所有<p>标签下的文本:

4

=A1.htmlparse@0("p")

获取A1中所有<p>标签下的文本,使用@0选项,保留null值:

5

=A1.htmlparse@p("p")

获取A1中所有<p>标签下的文本,使用@p选项,解析文本为相应类型的数值: