文章詳情頁

Python爬取YY評級分數并保存數據實現過程解析

瀏覽：2日期：2022-07-23 16:44:35

前言

當需要進行大規模查詢時（比如目前遇到的情形：查詢某個省所有發債企業的YY評級分數），人工查詢顯然太過費時，那就寫個爬蟲吧。

由于該爬蟲實在過于簡單，就只簡單概述下。

一、請求端

通過觀察YY評級的網頁信息，如下圖（F12或右擊進入檢查，點擊network—>XHR—>headers）。

紅色框表明是個get請求（其實這種網頁基本都是Ajax get，需要總結實際url的規律的）。

綠色框即為實際URL，通過分析該URL，其由兩部分組成。前半部分為“https://web.ratingdog.cn/v1/search?”，后半部分為黃色框內內容用“&”符號連接后的結果。黃色框內的內容，只有企業名稱為變量，且為已知變量，那URL即可據此確定了。

Python爬取YY評級分數并保存數據實現過程解析

另外需注意，YY評級需要登錄才可查詢數據，在構建頭部信息進行訪問時，一定要提前登錄，并在頭部信息中放入登錄信息和登錄狀態。

二、響應端

通過觀察網頁的響應信息（F12或右擊進入檢查，點擊network—>XHR—>response），如下圖。響應信息及其簡單，我們所需要的YY評級分數安詳地躺在那里，簡單到一個正則表達式就可以提取出該數據。正則如下：

'msg'.*?'IssuerName':'(.*?)','YYRating':'(.*?)/10','IntrinsicRating'.*?'

Python爬取YY評級分數并保存數據實現過程解析

三、代碼

所需數據較少，代碼相對簡單，就不建立函數了，直接一路到底吧。如下：

Python爬取YY評級分數并保存數據實現過程解析

運行代碼后，得到結果如下。安徽省的100多條數據，就到了本地了

Python爬取YY評級分數并保存數據實現過程解析

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持好吧啦網。

Python 編程

上一條：Python如何在main中調用函數內的函數方式下一條：基于Python繪制個人足跡地圖

相關文章：

1. Java 3D的動畫展示(Part1-使用JMF)2. 解決docker與vmware的沖突問題3. IntelliJ IDEA設置自動提示功能快捷鍵的方法4. asp.net core應用docke部署到centos7的全過程5. Python基于jieba, wordcloud庫生成中文詞云6. IntelliJ Idea 2020.1 正式發布,官方支持中文（必看）7. Django中的AutoField字段使用8. 刪除docker里建立容器的操作方法9. php相對路徑轉化成絕對路徑10. 簡體中文轉換為繁體中文的PHP函數

排行榜

					
					Java 3D的動畫展示(Part1-使用JMF)
IntelliJ IDEA設置自動提示功能快捷鍵的方法
Python基于jieba, wordcloud庫生成中文詞云
解決docker與vmware的沖突問題
IntelliJ Idea 2020.1 正式發布,官方支持中文（必看）
asp.net core應用docke部署到centos7的全過程
Django中的AutoField字段使用
ajax4jsf 1.0.2 發布,添加新的a4j tags.
刪除docker里建立容器的操作方法
Html5播放器實現倍速播放的方法示例
Django:使用filter的pk進行多值查詢操作