Python3实战之爬虫抓取网易云音乐的热门评论

脚本专栏 2024/11/15 佚名

2 0 1

金狮镖局 Design By www.egabc.com

前言

之前刚刚入门python爬虫，有大概半个月时间没有写python了，都快遗忘了。于是准备写个简单的爬虫练练手，我觉得网易云音乐最优特色的就是其精准的歌曲推荐和独具特色的用户评论，于是写了这个抓取网易云音乐热歌榜里的热评的爬虫。我也是刚刚入门爬虫，有什么意见和问题欢迎提出，大家一起共同进步。

废话就不多说了～下面来一起看看详细的介绍吧。

我们的目标是爬取网易云中的热歌排行榜中所有歌曲的热门评论。

这样既可以减少我们需要爬取的工作量，又可以保存到高质量的评论。

实现分析

首先，我们打开网易云网页版，如图：

点击排行榜，然后点击左侧云音乐热歌榜，如图：

我们先随便打开一个歌曲，找到如何抓取指定的歌曲的热门歌评的方法，如图，我选了一个最近我比较喜欢的歌曲为例：

进去后我们会看到歌评就在这个页面的下面，接下来我们就要想办法获取这些评论。

接下来打开web控制台(chrom的话打开开发者工具，如果是其他浏览器应该也是类似)，chrom下按F12，如图：

选则Network，然后我们按F5刷新一下，刷新之后得到的数据如下图所示：

可以看到浏览器发送了非常多的信息，那么哪一个才是我们想要的呢？这里我们可以通过状态码做一个初步的判断，status code（状态码）标志了服务器请求的状态，这里状态码为200即表示请求正常，而304则表示不正常（状态码种类非常多，如果要想详细了解可以自行搜索，这里不说304具体的含义了）。所以我们一般只用看状态码为200的请求就可以了，还有就是，我们可以通过右边栏的预览来粗略观察服务器返回了什么信息（或者查看响应）。通过这两种方法结合一般我们就可以快速找到我们想要分析的请求。通过反复的查找，终于找到了含有歌评的请求，如图：

可能截图在CSDN上不是很清楚，我们在一个Name为R_SO_4_489998494"text-align: center">


请求头部： 


 


请求中的表单数据： 



我们可以看到，包含这首歌歌评的请求url为http://music.163.com/weapi/v1/resource/comments/R_SO_4_489998494"text-align: center">
至此，我们已经确定了方向了，即只需要确定params和encSecKey这两个参数值即可。但是这两个参数是经过特定的算法进行加密的，怎么办呢？我发现了一个规律，http://music.163.com/weapi/v1/resource/comments/R_SO_4_489998494"text-align: center">
按F12，进入WEB工作台，如图：

我们在一个名为toplist"text-align: center">
我们预览一下该请求返回的结果，如图：

我们在代码的第524行我们找到了包含歌曲信息的代码，如图：

因此，我们只需要将该请求的代码中，将包含信息的代码筛选出来。 


我们在这里使用正则表达式进行数据筛选。 


通过观察特点，我们可以通过两次正则表达式的筛选，将我们需要的歌曲信息提取出来。 


第一次正则表达式我们将该请求返回的所有代码中，提取出第525行代码。 


第一次正则表达式如下：<ul class="f-hide"><li><a href="/song\" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" >.*</a></li></ul>
第二次正则表达式我们将该第524行中我们需要的歌曲信息提取出来，我们需要歌曲的歌名和id，对应的正则表达式如下： 


获取歌名：<li><a href="/song\" rel="external nofollow" rel="external nofollow" rel="external nofollow" rel="external nofollow" >(.*"/song\" rel="external nofollow" rel="external nofollow" >.*"color: #ff0000">代码如下：



#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import re
import urllib.request
import urllib.error
import urllib.parse
import json



def get_all_hotSong():  #获取热歌榜所有歌曲名称和id
 url='http://music.163.com/discover/toplist"f-hide"><li><a href="/song\">.*</a></li></ul>' #进行第一次筛选的正则表达式
 result=re.compile(pat1).findall(html)  #用正则表达式进行筛选
 result=result[0]  #获取tuple的第一个元素

 pat2=r'<li><a href="/song\">(.*"/song\">.*"text-align: center">
对比一下网页上《如果我爱你》这首歌的歌评和我们保存下的歌评：


信息无误～
总结
以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对的支持。


                                
                                    python爬虫抓取数据,python3网易云评论,python抓取网易云音乐 
                                
                                    标签：
                                        python爬虫抓取数据,python3网易云评论,python抓取网易云音乐
                                     

                                金狮镖局 Design By www.egabc.com


                        
                            
                                金狮镖局
                                免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！
                                如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com
                            
                        
                        
                            
                                上一篇
                                使用paramiko远程执行命令、下发文件的实例
                            
                            
                                下一篇
                                解决Scrapy安装错误:Microsoft Visual C++ 14.0 is required...
                            
                        
                        
                        金狮镖局 Design By www.egabc.com
                        
                            
                                
                                
                                    评论“Python3实战之爬虫抓取网易云音乐的热门评论”
                                
                            
                            
                                
                                    
                                        
                                            
                                                
                                                    
                                                
                                                
                                                    
                                                
                                                
                                                    
                                                    
                                                    
                                                
                                                
                                                     再想想
                                                    
                                                    
                                                    
                                                    
                                                    
                                                
                                            
                                            
                                        
                                    
                                    
                                    
                                        暂无Python3实战之爬虫抓取网易云音乐的热门评论的评论...


                    
                        
                            
                                
                                    
                                        
                                    
                                    
                                        
                                            
                                        
                                    
                                
                                
                                    www.egabc.com
                                            
                                                金狮镖局 
                                    
                                    
                                        
                                            
                                        
                                        
                                            
                                        
                                        
                                            
                                        
                                        
                                            
                                        
                                    
                                    
                                    
                                        
                                            139,976影音资源
                                        
                                        
                                            144,792福利资源
                                        
                                        
                                            21,817软件资源
                                        
                                        
                                            631,128技术资源
                                        
                                    
                                
                            
                            
                                最新文章
                                
                                    
                                         
                                       
                                            
                                                
                                            
                                            
                                                
                                                    陈崎凡《CHEN》[FLAC/分轨][326.32MB]
                                                
                                                
                                                    
                                                        2024/11/15
                                                        
                                                         21
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    群星《我们的歌第六季 第2期》[320K/MP3][7
                                                
                                                
                                                    
                                                        2024/11/15
                                                        
                                                         5
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    群星《我们的歌第六季 第2期》[FLAC/分轨][
                                                
                                                
                                                    
                                                        2024/11/15
                                                        
                                                         42
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    童丽《每一个晚上》[低速原抓WAV+CUE]
                                                
                                                
                                                    
                                                        2024/11/15
                                                        
                                                         40
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    乌兰齐齐格《呼伦牧歌》[原抓WAV+CUE]
                                                
                                                
                                                    
                                                        2024/11/15
                                                        
                                                         25


            
            
                
                    
                        
                            更新日志
                        
                        
                            
                                
                                    2024年11月15日
                                
                                                    
                        
 
                            陈崎凡《CHEN》[FLAC/分轨][326.32MB]
 
                            群星《我们的歌第六季 第2期》[320K/MP3][74.05MB]
 
                            群星《我们的歌第六季 第2期》[FLAC/分轨][385.16MB]
 
                            童丽《每一个晚上》[低速原抓WAV+CUE]
 
                            乌兰齐齐格《呼伦牧歌》[原抓WAV+CUE]

                        
                    
                    
                        2024年11月15日
                    
                    
                        
 
                            黄乙玲1988-无稳定的爱心肝乱糟糟[日本东芝1M版][WAV+CUE]
 
                            群星《我们的歌第六季 第3期》[320K/MP3][70.68MB]
 
                            群星《我们的歌第六季 第3期》[FLAC/分轨][369.48MB]
 
                            群星《燃！沙排少女 影视原声带》[320K/MP3][175.61MB]
 
                            乱斗海盗瞎6胜卡组推荐一览 深暗领域乱斗海盗瞎卡组分享
 
                            炉石传说乱斗6胜卡组分享一览 深暗领域乱斗6胜卡组代码推荐
 
                            炉石传说乱斗本周卡组合集 乱斗模式卡组最新推荐
 
                            佟妍.2015-七窍玲珑心【万马旦】【WAV+CUE】
 
                            叶振棠陈晓慧.1986-龙的心·俘虏你（2006复黑限量版）【永恒】【WAV+CUE】
 
                            陈慧琳.1998-爱我不爱（国）【福茂】【WAV+CUE】
 
                            咪咕快游豪礼放送，百元京东卡、海量欢乐豆就在咪咕咪粉节！
 
                            双11百吋大屏焕新“热”，海信AI画质电视成最大赢家
 
                            海信电视E8N Ultra：真正的百吋，不止是大！
 
                            曾庆瑜1990-曾庆瑜历年精选[派森][WAV+CUE]
 
                            叶玉卿1999-深情之选[飞图][WAV+CUE]

                        
                    
                            
                        
                    
                
            
            
                
                    友情链接 
                
                    
                        杰晶网络
                        DDR爱好者之家
                        桃源资源网
                        杰网资源
                        富贵资源网
                        南强小屋
                        铁雪资源网
                        幽灵资源网
                        万梅资源网
                        狼山资源网
                        白云岛资源网
                        昆仑资源网
                        相思资源网
                        明霞山资源网
                        内蒙古资源网
                        黑松山资源网
                        茶园资源网
                        饿虎岗资源网
                        大旗谷资源网
                        常春岛资源网
                        岱庙资源网
                        兴国资源网
                        快活林资源网
                        蝙蝠岛资源网
                        帝王谷资源网
                        白云城资源网
                        伏龙阁资源网
                        清风细雨楼
                        天枫庄资源网
                        圆月山庄资源网
                        无争山庄资源网
                        神水资源网
                        移花宫资源网
                        神剑山庄资源网
                        无为清净楼资源网
                        金钱帮资源网
                        丐帮资源网
                        华山资源网
                        极乐门资源网
                        小李飞刀资源网
                        凤求凰客栈
                        风云阁资源网
                        金狮镖局
                        鸳鸯亭资源网
                        千金楼资源网
                        更多链接
                    
                
            
            金狮镖局 Design By www.egabc.com
            
                
                    
                        
                    
                    
                        
                    
                
                
                    
                       金狮镖局 Copyright © 2006~2023 Design by www.egabc.com  手机版