![Python网络爬虫入门到实战](https://wfqqreader-1252317822.image.myqcloud.com/cover/96/48894096/b_48894096.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
CHAPTER 1
第1章 HTML与CSS基础
1.1 概述引导
本章介绍HTML和CSS,但不对有关JS的内容进行讲解,因为本书中并不学习关于JS相关的爬虫技术。对于有网页基础的读者可以跳过本章,本书主要讲解网页爬虫,因此考虑到大多数初学者并没有掌握基本的网页知识,因此本章专为没有网页基础的读者打下厚实的基础。
什么是HTML呢?以某搜索为例。某搜索的链接为https://cn.bing.com/,使用鼠标右键单击所在网页,在弹出的快捷键中选择“检查”命令,如图1-1所示。
![](https://epubservercos.yuewen.com/21A8BA/28606725804710806/epubprivate/OEBPS/Images/16_01.jpg?sign=1739300776-5pokiyJCGNQRTUw6KvHKXpf77z55geP7-0-7fe2b1bd96f5abda0a4a20762cfff431)
•图1-1 检查网页
将会看到右侧出现的代码串,这些就是基本的HTML,如图1-2所示。
![](https://epubservercos.yuewen.com/21A8BA/28606725804710806/epubprivate/OEBPS/Images/16_02.jpg?sign=1739300776-QJZsydvXByYXElNwbS2GuhrzkdnxDNpB-0-dd17e6eb901149719a664c06a4bd15eb)
•图1-2 HTML代码串
当然,这里内部还嵌入了一些CSS和JS,暂时先不做介绍。右上方还有一个常用的功能。单击“网络”标签页,这里可以看到具体素材的构建,如图1-3所示。
![](https://epubservercos.yuewen.com/21A8BA/28606725804710806/epubprivate/OEBPS/Images/17_01.jpg?sign=1739300776-1x2ODw2ScU7Ifn1augmuISp7HeYZt3f0-0-c2ae69e38c62b5b86870a6e5e2765d19)
•图1-3 具体素材的构建