描述:
自动识别字符串或文本文件的编码。
语法:
chardetect(param)
备注:
无选项时表示对文本文件进行字符编码识别。支持UTF-8、GBK、UTF-16LE、UTF-16BE等编码。
文本文件原编码为GBK、GB2312、GB18030,统一识别为GB18030;识别字符串或二进制值编码时,由于中(繁体)日韩字符编码范围有重复,可返回多个可能的编码值。
选项:
@v |
识别字符串或二进制值 |
参数:
param |
所要识别的字符串、二进制值、文本文件的文件名、文本文件的文件对象或url |
返回值:
编码值或编码值序列
示例:
|
A |
|
1 |
>www="http://www.baidu.com" |
|
2 |
=chardetect(www) |
UTF-8 |
3 |
=chardetect@v("abc一二三123") |
GB-2312 |
4 |
>file1="d:/UTF8.xml" |
文件编码为UTF-8 |
5 |
>file2="d:/UTF16LE.xml" |
文件编码为UTF16LE |
6 |
=chardetect(file1) |
UTF-8 |
7 |
=file(file2) |
|
8 |
=chardetect(A7) |
UTF-16LE |
9 |
=chardetect@v("你好") |
|