運(yùn)用PHP函數(shù)parse_url分析信息抓取
PHP是一個(gè)功能強(qiáng)大的嵌入式HTML語言,擁有種類繁多的函數(shù)庫,幫助我們實(shí)現(xiàn)許多功能。PHP中一個(gè)好用的PHP函數(shù)parse_url,就可以幫助我們特別方便用來做信息抓取的分析,舉例子如下: #t#
- $url = "http://www.electrictoolbox.
com/php-extract-domain-from-full-url/"; - $parts = parse_url($url);
輸出:
- Array
- (
- [scheme] => http
- [host] => www.electrictoolbox.com
- [path] => /php-extract-
domain-from-full-url/ - )
又如PHP函數(shù)parse_url使用方法:
- < ?php
- $url = 'http://username:password
@hostname/path?arg=value#anchor';- print_r(parse_url($url));
- echo parse_url($url, PHP_URL_PATH);
- ?>
輸出:
- Array
- (
- [scheme] => http
- [host] => hostname
- [user] => username
- [pass] => password
- [path] => /path
- [query] => arg=value
- [fragment] => anchor
- )
可以看到,PHP函數(shù)parse_url可以很容易分解出一個(gè)URL的各個(gè)部,那如果要拿指定的部分出來的話也很容易,如
echo parse_url($url, PHP_URL_PATH);就是在第二個(gè)參數(shù)中,設(shè)定如下的參數(shù):
PHP_URL_SCHEME, PHP_URL_HOST, PHP_URL_PORT, PHP_URL_USER, PHP_URL_PASS, PHP_URL_PATH, PHP_URL_QUERY or PHP_URL_FRAGMENT.