php采集新浪微博
作者:佚名
現(xiàn)在是大數(shù)據(jù)時(shí)代,我們分析的是什么?什么樣的數(shù)據(jù)對我們有用呢?數(shù)據(jù)的需求量比較大,在本地弄得一個(gè)小的測試,很簡單,我在本地做了一個(gè)簡單的測試,采集新浪微博每五分鐘采集最新的微博,這個(gè)沒有什么技術(shù)含量需要的就是數(shù)據(jù)而已,現(xiàn)在開始吧!首先你要熟悉我上一篇文章定時(shí)計(jì)劃,這個(gè)需要定時(shí)計(jì)劃的哦!
現(xiàn)在是大數(shù)據(jù)時(shí)代,我們分析的是什么?什么樣的數(shù)據(jù)對我們有用呢?數(shù)據(jù)的需求量比較大,在本地弄得一個(gè)小的測試,很簡單,我在本地做了一個(gè)簡單的測試,采集新浪微博每五分鐘采集最新的微博,這個(gè)沒有什么技術(shù)含量需要的就是數(shù)據(jù)而已,現(xiàn)在開始吧!首先你要熟悉我上一篇文章定時(shí)計(jì)劃,這個(gè)需要定時(shí)計(jì)劃的哦!
建立一個(gè)數(shù)據(jù)庫
- DROP TABLE IF EXISTS `weibo_data`;
- CREATE TABLE `weibo_data` (
- `id` int(10) unsigned NOT NULL AUTO_INCREMENT,
- `content` varchar(1000) NOT NULL, //用戶發(fā)送的內(nèi)容
- `username` varchar(250) NOT NULL, //用戶的昵稱
- `location` varchar(250) DEFAULT NULL, //用戶的地理位置
- `description` varchar(500) DEFAULT NULL, //用戶的描述信息
- `avatar` varchar(250) DEFAULT NULL, //用戶的頭像地址
- `wurl` varchar(250) NOT NULL, //用戶的新浪微博地址
- `time` varchar(200) NOT NULL, //采集的時(shí)間
- `mid` varchar(250) DEFAULT NULL, //用戶的mid
- `sex` varchar(10) NOT NULL, //用戶的性別 f 女 m 男
- PRIMARY KEY (`id`)
- ) ENGINE=InnoDB AUTO_INCREMENT=97 DEFAULT CHARSET=utf8;
然后我們下載新浪給的sdk,組成下邊的代碼,最好弄個(gè)數(shù)據(jù)庫的類,我用的dedecms的
- <?php
- session_start();
- require 'mysql.class.php';
- $time=time();
- include_once( 'config.php' );
- include_once( 'saetv2.ex.class.php' );
- //echo $_SESSION['token']['access_token'];
- $c = new SaeTClientV2( "199660149" , "b67164665e6556e08xxxxxx" , "2.00IXVubC0zikVxxxxxxx" ); // 第一個(gè)是appid 第二個(gè)是app key 第三個(gè)是token 在你登陸的時(shí)候輸出一下 然后寫到這里就可以了
- $remen = $c->public_timeline();
- foreach($remen["statuses"] as $v){
- $result = $db->ExecNoneQuery("insert into weibo_data (`content`,`username`,`location`,`description`,`avatar`,`wurl`,`time`,`mid`,`sex`) values ('{$v1}','{$v[user][screen_name]}','{$v[user][location]}','{$v[user][description]}','{$v[user][profile_image_url]}','http://weibo.com/{$v[user][profile_url]}','{$time}','{$v[mid]}','{$v[user][gender]}')");
- }
- if($result){
- echo "成功導(dǎo)入";
- }
ok做到這里我們就采集到了數(shù)據(jù),然后你也可以根據(jù)接口,做定向任務(wù)的定時(shí)的采集,譬如說采集哪些用戶,是否采集你的好友的微博,或者采集你指定的用戶的微博,然后發(fā)布到你的微博上這個(gè)都是可以的!效果就是這樣的!
責(zé)任編輯:陳四芳
來源:
微度網(wǎng)絡(luò)