前言
大家平時在用Python爬取網(wǎng)頁上的數(shù)據(jù)時,對爬取到到的數(shù)據(jù)做數(shù)據(jù)分析展現(xiàn)有很多種方式,比如可以通過echart圖表接口、python提供的第三方庫甚至還可以用matlab工具來進(jìn)行數(shù)據(jù)統(tǒng)計和圖表可視化展現(xiàn)。可是無論是以上的哪一種方式,都需要通過代碼來調(diào)用Python爬好的數(shù)據(jù)來進(jìn)行畫圖,圖表樣式屬性設(shè)置等方面還是比較繁瑣的。
今天呢,小編將給大家推薦一件輕量級數(shù)據(jù)分析可視化展現(xiàn)的神器——FineBI(個人使用完全免費(fèi),僅對企業(yè)收費(fèi)),操作簡單上手快,無須任何代碼,直接在瀏覽器端通過FineBI工具的鼠標(biāo)拖拽和點(diǎn)擊操作即可生成色彩絢麗的可視化圖表效果。特別是對于企業(yè)的業(yè)務(wù)人員來說,有了這一款只需托拖拽拽的數(shù)據(jù)分析統(tǒng)計神器,老板再也不用盯著之前做的密密麻麻和單調(diào)的excel圖表看啦!
原理介紹
AIeW9k+S8mueIrOiZq+eahFB5dGhvbumBh+S4iuS8mueUu+WbvueahEZpbmVCSQ=="/>
在此之前簡單給大家講講我們這次給大家分享的Python爬蟲+FineBI數(shù)據(jù)展現(xiàn)的系統(tǒng)原理,如上圖所示,數(shù)據(jù)層方面我們先通過Python抓取到WEB端的網(wǎng)頁數(shù)據(jù),之后對爬取到數(shù)據(jù)進(jìn)行解析再而存儲到MYSQL數(shù)據(jù)入庫;最后應(yīng)用層的數(shù)據(jù)處理、數(shù)據(jù)計算統(tǒng)計、圖表可視化呈現(xiàn)等工作全都交由我們的FineBI工具完成。
最近因為想看看南京房價數(shù)據(jù),但是網(wǎng)站上的很多數(shù)據(jù)都是以HTM5的形式進(jìn)行呈現(xiàn)的,所以考慮通過Python來進(jìn)行網(wǎng)頁數(shù)據(jù)抓取和入庫,數(shù)據(jù)分析方面通過FineBI工具直接和數(shù)據(jù)庫進(jìn)行無縫對接和可視化呈現(xiàn),空想不如行動~說干就干。
實(shí)現(xiàn)步驟
1.引入相關(guān)python庫包
首先新建python工程,引入本次爬取網(wǎng)頁數(shù)據(jù)和寫入MySQL數(shù)據(jù)庫所需要的requests、pymysql、bs4這三個包:
AIeW9k+S8mueIrOiZq+eahFB5dGhvbumBh+S4iuS8mueUu+WbvueahEZpbmVCSQ=="/>
2.獲取網(wǎng)頁數(shù)據(jù)
然后如下圖所示,通過編寫Python代碼獲取到某一個房產(chǎn)網(wǎng)頁的南京售房平臺的網(wǎng)頁信息:
AIeW9k+S8mueIrOiZq+eahFB5dGhvbumBh+S4iuS8mueUu+WbvueahEZpbmVCSQ=="/>
3.HTML標(biāo)簽解析
接著再對DIV樣式下的HTML數(shù)據(jù)包進(jìn)行逐一解析,獲取到我想看的房源名稱、地址、小區(qū)、戶型、面積、總價、單價、區(qū)域等數(shù)據(jù):
其中對應(yīng)網(wǎng)頁的標(biāo)簽樣式可以通過瀏覽器的F12開發(fā)選項進(jìn)行快速獲取,如下圖所示的定位房源信息截圖,我們只需要右鍵瀏覽器在所需要獲取標(biāo)簽樣式名稱的地方點(diǎn)擊檢查元素即可(房源名稱的標(biāo)簽即位house-title的title元素)。
4.MySQL數(shù)據(jù)回寫
解析好數(shù)據(jù)之后,再將解析好的數(shù)據(jù)寫入到MySQL數(shù)據(jù)庫中:
循環(huán)遍歷該平臺在南京最近七天的網(wǎng)頁售房信息數(shù)據(jù),頁面17頁,共計377條數(shù)據(jù):
5.安裝FineBI&&驗證數(shù)據(jù)入庫
通過FineBI官網(wǎng)下載并按照引導(dǎo)安裝好軟件:
直接通過FineBI提供的數(shù)據(jù)配置端的功能,添加SQL數(shù)據(jù)集(或者直接添加表也行),查看我和驗證剛剛爬取并且入庫的數(shù)據(jù)是否已經(jīng)真正成功入庫到MySQL中了。
如下圖所示,Python果然不辱使命,我要的該平臺的七天南京的房價售房數(shù)據(jù)都已經(jīng)成功寫入到了我的MySQL數(shù)據(jù)庫中了。
6.FineBI可視化制作&&成果展示
通過FineBI的簡單拖拽,我這邊以南京各小區(qū)房價分布圖為例給大家簡單展示FineBI的可視化呈現(xiàn)過程(操作真的非常簡單,小白可以通過FineBI官網(wǎng)的幫助文檔或者視頻快速入門~會用excel的,基本半個小時就能上手):
僅僅簡單十分鐘,刷刷的就將我想要看的南京售房信息(房源面積均價、套房總均價、小區(qū)房價四象限分布圖、區(qū)域房價分析、房型價格分析)以可視化的形式呈現(xiàn)出來了。
最后就是本次成果展示啦,也曬出來跟大家分享下,如下所示:
1.目前南京房源均價為3.78萬每平方米,總均價為401.38萬,總體上還是比較高的。
2.建鄴區(qū)房價最高,果然房價還是緊跟國家政策啊,建鄴目前城區(qū)開發(fā)建設(shè)政府的扶持力度在南京都是走在前面的。鼓樓、玄武、秦淮分別排在二、三、四的位置,雨花臺和江寧房價相對較低,綜合市區(qū)位置來看,還是秦淮區(qū)性價比最高啊 。
3.房型方面,6室3廳的豪華大宅總均價接近一千萬,比如紫檀雅居、碧水灣別墅、濱江奧城聽雨苑這一類土豪小區(qū),多集中在建鄴和鼓樓區(qū)域;一室一廳的房子均價大概在150萬的樣子,比如托樂嘉單身公寓、經(jīng)緯城市花園等小區(qū),適合單身貴族或者情侶小夫婦居住,南京各個大區(qū)都有;比較主流的三室一廳房價在300萬左右,比如喬虹苑小區(qū)、良辰美景家園、白云園,多集中在秦淮和鼓樓區(qū)域。
后記
Python完成對網(wǎng)頁數(shù)據(jù)的抓取和解析存儲之后,配合FineBI強(qiáng)大的數(shù)據(jù)可視化呈現(xiàn)能力則圓滿地完成了我本次對南京售房數(shù)據(jù)的統(tǒng)計和分析需求,絕對是良心軟件!
網(wǎng)頁爬蟲數(shù)據(jù)抓取,Python首屈一指,對于數(shù)據(jù)統(tǒng)計和可視化展現(xiàn)方面來說,操作簡單便捷、拖拽式的FineBI絕對是數(shù)據(jù)分析小白的入門上佳之選,小編在此給大家強(qiáng)烈推薦學(xué)習(xí)。
最后特別是對于企業(yè)經(jīng)營來說,F(xiàn)ineBI的企業(yè)級數(shù)據(jù)管控和自助分析經(jīng)營能力更加強(qiáng)大,由于篇幅有限,感興趣的可以自行到FineBI產(chǎn)品的官網(wǎng)進(jìn)行學(xué)習(xí)試用。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 比亞迪第五代DM技術(shù)問世,首搭秦L/海豹06 DM-i,開創(chuàng)油耗2時代!
- 小紅書沉帖降權(quán)怎么做,有效方法大盤點(diǎn)!
- 亞洲時刻京東送上電視好禮 以舊換新一體化服務(wù)讓低價更靠譜
- 互聯(lián)網(wǎng)營銷師和全媒體運(yùn)營師的區(qū)別?
- 聯(lián)想集團(tuán)車計算“超級大腦”概念機(jī)亮相
- 華策影視設(shè)立專項基金成立AIGC應(yīng)用研究院
- 三部委審批,聯(lián)合發(fā)布9個新職業(yè),“互聯(lián)網(wǎng)營銷師”上榜
- 互聯(lián)網(wǎng)營銷師的報考條件是什么?
- 互聯(lián)網(wǎng)營銷師的適合人群有哪些?
- 互聯(lián)網(wǎng)營銷師行業(yè)前景怎么樣?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。