首页技术文章正文

【Python面经题】爬虫数据为什么选择Mongodb存储?

更新时间:2021-01-18 来源:黑马程序员 浏览量:

1577370495235_学IT就到黑马程序员.gif

(1)问题分析

面试官主要考核Mongodb和MySQL数据库的特点,以及关系型与非关系型数据库。

(2)核心问题讲解

MySQL属于关系型数据库,它具有以下特点:

在不同的引擎上有不同的存储方式。

查询语句是使用传统的sql语句,拥有较为成熟的体系,成熟度很高。

开源数据库的份额在不断增加,MySQL的份额也在持续增长。

处理海量数据的效率会显著变慢。

Mongodb属于非关系型数据库,它具有以下特点:

数据结构由键值对组成。

1610949080888_文章-图-正式-恢复的.gif

存储方式:虚拟内存+持久化。

查询语句是独特的Mongodb的查询方式。

可以通过副本集、分片来实现高可用。

数据是存储在硬盘上的,只不过需要经常读取的数据会被加载到内存中,将数据存储在物理内存中,从而达到高速读写。

新兴数据库,成熟度较低。

(3)问题扩展

关系型数据库可以理解为依赖一个模型来创建的数据库,比如我们使用的MySQL中的表是由横列和纵列组成的一个二维表格。关系型数据库可以通过关系模型使多个表的数据关联起来,比如我们平时说的 一对一、一对多、多对一。由于是建立在数据模型的基础上,所以我们可以通过SQL语句很方便的在多个表之间做复杂的查询操作。关系型数据库相对安全,因为直接存储在硬盘中所以突然的宕机、停电等意外不会导致数据丢失。MySQL的存储方式是由自身的引擎决定的,常用的引擎有Innodb和MyISAM。他们主要的区别就是MyISAM 不支持事务,强调的是性能,执行速度比Innodb要快,Innodb提供支持事务等高级数据库功能。

非关系型数据库即我们常说的NoSQL数据库,部署起来都比较简单,没有关系型数据库那么复杂。Mongo的存储方式为虚拟内存+持久化存储,Mongo将数据写入内存中,再由虚拟内存管理器将其持久化到硬盘中,因此写操作会比关系型数据库快很多。NOSQL的存储格式是key-value形式,可以像关系型数据库那样存储基础数据类型的数据,也可以存储集合、对象等等。NoSQL虽然性能比较高,但是并不支持事物,也不能进行联表查询,一般用于较大规模数据的存储。

(4)结合项目中使用




猜你喜欢:

MongoDB下载和安装图文教程

PMySQL和MariaDB有什么区别?

什么是mysql事务场景?

黑马Python培训课程

分享到:
在线咨询 我要报名
和我们在线交谈!