首先开头的http代表了所使用的获取资源的协议,该URL显示获取这个网页资源要使用的是HTTP。然后,info.cern.ch这部分指明了资源所在的服务器,它是一个域名(domainname)。域名将难以理解的网络地址抽象为一个个可以被人类记忆并理解的英文单词组合,便于人们的使用和访问。之后的/hypertext/WWW/这部分代表了所要获取资源所在的路径(path),即一张网页所在服务器的文件路径,这部分的原理就如同在平时使用的计算机上定位文件一样。最后的TheProject.html这部分代表了所要获取资源的文件名,即具体的一个HTML文档。——《HTML5基础与实践教程》
res.content
除了文本内容的下载,爬虫还能下载图片、音频、视频等。我们来看一个下载图片的例子:
(图一)
以下载上面的图片为例,图片地址是:网页链接。
下载图片的代码如下:
(图二)
我们可以看到,和下载小说的步骤几乎一样,区别在于图片是用二进制写入的方式,将数据的二进制形式写入文件当中,而不是字符串形式。
如果你将图片的res.content打印出来,结果是像下面这样的一堆看不懂的乱码:
(图三)
上面的乱码其实是图片的二进制编码,当我们用错误的方式打开,比如用文本形式打开,就会出现如上所示的乱码。
所以res.text和res.content的区别是:res.text用于文本内容的获取、下载,res.content用于图片、音频、视频等二进制内容的获取、下载。
我们再来试试图片的下载,点击运行按钮即可。你也可以将图片链接换成你希望下载的图片试试哦~
Tips:下载的文件会出现在运行结果区。如果你在本地运行下面的代码,下载的文件将会出现在代码文件所在的目录下。
注意:因为手机端的限制,下载的文件无法展示,请前往电脑端获得完整体验,网址:扇贝编程。
(图四)
最近一周前端精选文章推荐,文章详情及更多见前端精选
1、ECMAScript 2021 (ES12)通过,正式写入 ECMAScript 标准
2021 年
6 月 22 日,第 121 届 Ecma 国际(Ecma International)大会以远程会议形式召开。 ECMAScript 2021 (ES12)成为事实的 ECMAScript 标准,并被写入 ECMA-262 第 12 版。
2、Chrome 92 DevTools 的新功能
Chrome 92 DevTools 的新功能,CSS Grid编辑器是一个社区呼声很高的特性。现在你可以通过它来预览和创建 CSS Grid 布局了。
3、5个拥有JavaScript原生SDK的云数据库
使用云数据库为你的应用程序打开了一套全新的功能。但是,为你的要求选择一个完美的云数据库解决方案可能比想象的要难。因此,在这篇文章中,将讨论5个针对JavaScript的云数据库解决方案,并进行功能比较,以帮助你为下一个项目选择最佳方案。
4、Next.js 11的新功能
在6月15日举行的2021年Next.js大会上,来自世界各地的开发者共同见证了Next.js 11的发布,这是Vercel团队的最新版本。Next.js 11中包含的更新和新功能为一个已经很受欢迎的库提供了重大改进。
5、抽象泄漏(Leaky Abstractions)
拥抱抽象泄漏,并把它当作抽象层级的一部分,在制定好规范的基础上鼓励调用者填补框架的认知空白。典型例子如 webpack, eslint 等工具的插件机制。与其逼迫调用者 &34; 你的抽象层,不如提供一个入口、邀请他们共建。
6、万字长文讲透低代码
要判断一个低代码平台是否专业,可以重点看模型驱动、可视化开发、表达式语言、软件工程、开放集成和脚本语言等六个方面。
更多见 前端精选周刊-前端精选周刊第二期
最全的全运会每日赛事全知道:中华人民共和国第十四届运动会信息发布系统:
中华人民共和国第十四届运动会信息发布系统
以上这个网址有最全的陕西全运会每日的赛事项目和时间:
比如今天的赛事见图1:
每个具体项目点相应的图标进去就能看到该项目的比赛时间和地点!
举个例子:点排球图标点进去就是图2青年女排的比赛时间地点
体育迷们可以收藏这条微,以便及时关注自己喜欢的比赛,自己喜欢的运动员!
今天看了些istio资料,有个问题不是很明白,看bookinginfo的例子,每个服务基本上是接口级的(就是一个服务对应一个接口方法),这种方式,在正式大规模应用里肯定不可行的,否则服务一大堆,服务部署也一大堆,那如果部署的是个粗颗粒度的服务,一个服务涵盖很多接口,那么岂不是把接口组织延后到应用里了?这岂不是跟istio号称对应用无感而实现微服务架构部署矛盾吗?
Sunny2022年第一场跨部门会议,会擦出什么精彩的火花呢?跟我一起期待美阳玻璃接下来的时间,给所有的外贸人分享外贸人必备工具,干货,赶紧收藏起来哦。
一.全球海关大数据查询:O网页链接
二.80+国际快递查询:网页链接
三.国外快递查询平台:
四.中国各口岸杂费明细参考:网页链接
五.世界各国进口关税税率查询:
六.通关状态查询:网页链接
七.出口退税率查询:
八.全美最大最全企业库:
九.Shopify销售查询:
十.邮箱,域名,IP地址自检自查工具:
(1)dnsbl.info(只要在输入框内输入邮箱域名,就可以自动搜索到所在IP地址。)
(2)
英女王伊丽莎白二世白金禧年特辑40/70。照片拍摄于1991年:女王为肯特郡达特福德泰晤士河上的新公路桥碑石揭幕。该桥梁命名为伊丽莎白女王大桥,是 50 多年来第一座在泰晤士河沿岸全新地点建造的大桥。
同年,英国科学家、互联网之父蒂姆·伯纳斯-李在万维网上公布了第一个网站,域名是 http://info.cern.ch。可惜的是当时的页面现在已经看不到了。
70张经典历史照片让你了解女王在位70年来的70个珍贵瞬间!并带你了解同年发生的重大事件。
冰墩墩和雪容融域名受追捧
北京冬奥会的吉祥物“冰墩墩”和“雪容融”因为其可爱的造型受到了来自全球各地区网友的喜爱和关注!爱屋及乌,这两个吉祥物对应的域名也自然收到了大众的关注。
据查询,两个吉祥物的全拼域名“bingdundun”、“xuerongrong”以及英文域名“bingdwendwen”、“shueyrhonrhon”域名均在吉祥物正式发布当天被抢注完成、info、shop等其余域名后缀也均在吉祥物发布的两日内被抢注一空,从中可以看出这两个吉祥物有关域名中蕴藏的巨大商业价值。
但值得注意的是,北京冬奥组委早已明确吉祥物的知识产权和奥林匹克标志保护事宜。除法律、法规另有规定外,未经北京冬奥组委许可,任何单位或者个人不得擅自使用吉祥物形象和名称。对侵犯吉祥物知识产权和奥林匹克标志专有权的行为,北京冬奥组委将依法追究侵权人的法律责任。
所以即使抢注下了有关域名,如果未经许可进行商业行为,也可能涉及到侵权违法。