篇垫饶讽惧想烙修借匣仟处儡
第一章 单元测试
1、 下列不属于常见爬虫类型的是( )。
A:通用网络爬虫
B:增量式网络爬虫
C:浅层网络爬虫
D:聚焦网络爬虫
答案: 浅层网络爬虫
2、 下列不属于聚焦网络爬虫的常用策略的是( )。
A:基于深度优先的爬取策略
B:基于内容评价的爬取策略
C:基于链接结构评价的爬取策略
D:基于语境图的爬取策略
答案: 基于深度优先的爬取策略
3、 下列不属于常用反爬手段的是( )。
A:反爬频度
B:验证码校验
C:账号权限
D:人工筛选
答案: 人工筛选
4、 下列属于反爬虫目的的是( )。
A:限制访问人数
B:防止网站信息被竞争对手随意获取
C:变换网页结构
D:限制用户访问权限
答案: 防止网站信息被竞争对手随意获取
5、 下列属关于Python爬虫库的功能描述不正确的是( )。
A:通用爬虫库urllib3
B:通用爬虫库 Requests
C:HTML/XML解析器pycurl<br>
D:爬虫框架 Scrapy<br>
答案: <span style="color:red">HTML/XML解析器pycurl
6、 搜索引擎使用了网络爬虫不停地从互联网抓取网站数据,并将网站镜像保存在本地。( )
A:对
B:错
答案: 对
7、 robots.txt文件中,User-agent后面跟的是爬虫的名称,Disallow后面跟着的是可以爬虫的网页。( )
A:对
B:错
答案: 错
8、 爬虫是手动请求万维网网站且提取网页数据的程序。( )
A:对
B:错
答案: 错
9、 每个网站都有robots.txt文件。( )
A:对
B:错
答案: 错
10、 爬虫爬取的是网站后台的数据。( )
A:对
B:错
答案: 错
第二章 单元测试
1、 吉多设计Python的灵感来源于( )。
A:C语言
B:Unix shell
C:ABC语言
D:Java语言
答案: ABC语言
2、 下列关于Python语言的特点说法中,错误的是( )。
A:Python语言是非开源语言
B:Python语言是跨平台语言
C:ANSI C
D:Go
答案: Python语言是非开源语言
3、 Python源代码文件的后缀名是( )
A:pdf
B:doc
C:png
D:py
答案: py
4、 列表list=[1,2,3,4,5],下列选项中为空的是( )
A:ist[1:1]
B:list[1:-1]
C:list[1:]
D:list[:-2]
答案: ist[1:1]
5、 Python语言中用来定义函数的关键字是( )
A:return
B:def
C:function
D:class
答案: def
6、 在安装Python时,需要根据已有的系统来选择相应的安装程序。安装后,也需要配置环境变量。( )
A:对
B:错
答案: 对
7、 elif语句可以单独使用。( )
A:对
B:错
答案: 错
8、 元组的元素不能修改。( )
A:对
B:错
答案: 对
9、 下列选项中,不能创建元组的语句是( )。
A:tup=[1,2,3]
B:tup=(2)
C:tup=tuple([1,2,3])
D:tup = (1,2,98)
答案: tup=[1,2,3]
tup=(2)
第三章 单元测试
1、 如果站点服务器支持安全套接层(SSL),那么连接到安全站点上的所有URL开头是( )。
A:HTTP
B:HTTPS
C:SHTTP
D:SSL
答案: HTTPS
2、 body元素用于背景颜色的属性是( )。
A:alink
B:vlink
C:color
D:background-color
答案: background-color
3、 为了标识一个HTML文件开始应该使用的HTML标记是 ( )。
A:
<table>
B:<body>
C:<html>
D:<a>
答案: <html>
4、 在HTML中,单元格的标记是( )。
A:<td>
B:<span>
C:<tr>
D:<body>
答案: <td>
5、 CSS 中的选择器不包括包括( )
A:超文本标记选择器
B:类选择器
C:ID选择器
D:元素选择器
答案: 超文本标记选择器
6、 ( )是网页与网页之间联系的纽带,也是网页的重要特色。
A:导航条
B:表格
C:框架
D:超链接
答案: 超链接
7、 在HTML中,下面是段落标签的是:( ) 。
A:<html></html>
B:<head></head>
C:<body></body>
D:<p></p>
答案: <p></p>
8、 ( )标签可以应用于〈head〉中。
A:<title>
B:<body>
C:<html>
D:<image>
答案: <title>
9、 下列哪一项是css添加背景图片的正确语法构成?( )
A:background-position
B:background-color
C:background-image
D:background-size
答案: background-image
10、 在HTML开发中,制作网站时首先需要考虑内容是( )
A:页面内容
B:页面布局
C:图片色彩
D:文字字体
第四章
答案: 页面布局
第四章 单元测试
1、 HTTPError 是 URLError 的子类,专门用来处理 HTTP 请求错误,比如认证请求失败等。它有 3 个属性,下列选项哪一个不是它的属性( )。
A:code
B:reason
C:headers
D:Response
答案: Response
2、 下列属于HTTP必须实现的请求方法的是( )。
A:POST与DELE
B:GET与HEAD
C:OPTIONS和CONNECT
D:TRACE和OPTIONS
答案: GET与HEAD
3、 下列关于HTTP状态码类型描述错误的是( )。
A:4XX表示客户端可能发生错误
B:5XX表示服务器可能发生错误
C:1XX表示请求已被服务器接受,无须后续处理
D:3XX表示客户端的请求需采取进一步操作
答案: 1XX表示请求已被服务器接受,无须后续处理
4、 通过加入特定的____,可以将爬虫发出的请求伪装成浏览器。( )
A:Request
B:opener
C:Headers
D:User_Agent
答案: User_Agent
5、 urlopen方法中的data 参数可以不是 bytes 类型。( )
A:对
B:错
答案: 错
6、 requests库中的requests.get(url)方法是请求目标网站,类型是一个HTTPresponse类型。( )
A:对
B:错
答案: 对
7、 如果访问某网站的频率太高,则这个网站可能会禁止访问。( )
A:对
B:错
答案: 对
8、 requests库中的requests.get(url)方法中包括两个(对象)请求,其中一个为Request请求,即向服务器请求资源的request对象,第二个是Response请求,即包含从服务器返回的所有资源。( )
A:对
B:错
答案: 对
9、 Response类用于动态地响应客户端的请求,控制发送给用户的信息,并且将动态地生成响应,包括状态码、网页的内容等。( )
A:对
B:错
答案: 对
上方为免费预览版答案,如需购买完整答案,请点击下方红字
点关注,不迷路,微信扫一扫下方二维码
关注我们的公众号:阿布查查 随时查看答案,网课轻松过
为了方便下次阅读,建议在浏览器添加书签收藏本网页
电脑浏览器添加/查看书签方法
1.按键盘的ctrl键+D键,收藏本页面
2.下次如何查看收藏的网页?
点击浏览器右上角-【工具】或者【收藏夹】查看收藏的网页
手机浏览器添加/查看书签方法
一、百度APP添加/查看书签方法
1.点击底部五角星收藏本网页
2.下次如何查看收藏的网页?
点击右上角【┇】-再点击【收藏中心】查看
二、其他手机浏览器添加/查看书签方法
1.点击【设置】-【添加书签】收藏本网页
2.下次如何查看收藏的网页?
点击【设置】-【书签/历史】查看收藏的网页
屁偶碗陵尺详覆投泻岭党社死