建议使用以下浏览器,以获得最佳体验。 IE 9.0+以上版本 Chrome 31+ 谷歌浏览器 Firefox 30+ 火狐浏览器
请选择 进入手机版 | 继续访问电脑版
设置昵称

在此一键设置昵称,即可参与社区互动!

确定
我再想想
选择版块
标签
您还可以添加5个标签
  • 没有搜索到和“关键字”相关的标签
  • 云产品
  • 解决方案
  • 技术领域
  • 通用技术
  • 平台功能
取消

运气男孩

发帖: 193粉丝: 24

级别 : 外部版主

发消息 + 关注

发表于2020年11月11日 01:50:27 211 4
直达本楼层的链接
楼主
显示全部楼层
[技术分享] 论数据库的重要性

论数据库的重要性,就好比今天11.11抢购,阿里的服务器连接了数据库,成千上万的人在其平台下单,而产生的巨额的数量量就存储在数据库里,包括用户的增删改查,退货什么的。那么,我从开发人员的角度解释下为什么数据库必不可少。


以一个简单的例子入手,假设现在要求你做一个简单的电影信息检索的网站,以供查询演员信息和电影信息,这些数据都存在普通文件中等待检索请求。

假设在文件中,数据以CVS的格式组织:

Actors.txt(name, gender,country)结构如下:

"Jacky Chan", “male”, "China"
"Tony Jaa", “male”,"Thailand"
"Tom Hanks", “male”, "USA"
“Jennifer Lawrence”, “female”, ”USA”

Movies.txt(name, protagonist, year) 结构如下:

"Rush Hour", “Jacky Chan”, 1998 
"Hunger Game", “Jennifer Lawrence”,2012
"Saving Private Ryan", “Tom Hanks”, 1998
"Sally", “Tom Hanks”, 2016


第一个请求,我要查询Saving Private Ryan上映的年份,是不是得用以下遍历函数:

for line in file: 
  record = parse(line)
      if "Saving Private Ryan"== record[0]: 
          print int(record[1])

可想而知,当某个文件有几百G的时候,你运行这样的查找程序试试?扫描文件,多次IO会让查询异常缓慢。这样的响应时间,任何应用恐怕都不能接受。即使全部数据全部放在内存,没有索引支撑,遍历一遍也是相当耗时的。然而,有了数据库,各种索引技术、内存缓存技术轻而易举的解决这个问题。


然后,我们再来考虑数据完整的问题(DATA INTEGRITY)。

(1)Movies.txt包含两条Tom Hanks主演电影,如何确保这两条记录里的Tom Hanks是同一个人?如何确定不是重名的演员?

(2)假如有人修改Movies.txt中某条记录的year属性为201y这种无效的年份表达怎么办?

(3)一部电影有多个主演时,这种情况该怎么存储?

显然文件系统不会考虑这些问题,作为网站的开发者,光考虑解决这些问题头都要爆炸了吧。而数据库的各种完整性约束会制定一些规则,保证数据的有效、完整、正确、一致。


此外,作为一个网站,每天成千上万的用户访问必不可少吧。那么当多个用户检索、修改同一文件里的数据时怎么处理?多个线程并发写一个文件、甚至写同一条记录时如何处理?在并发写的情况下,如果像文件系统一样,没有任何保证机制,难以想象数据会被写成什么样子。数据库的并发控制机制(基于锁、基于快照等)专门解决这类问题。


最后,关于数据的持久性。当正在更新某条记录时,系统崩溃了,这条数据会怎么处理?

另外,为防止磁盘损坏数据丢失,如何将数据高效的复制到另一台机器上做备份?文件系统显然不会考虑这些,但数据库系统却有相关机制保证数据持久正确可用。


数据面临的问题实在太多了,如果这些都要应用开发者去亲自处理,那这个工程得巨大到什么程度?这个时候,数据库的重要性就不言而喻了。


举报
分享

分享文章到朋友圈

分享文章到微博

一只无脑程序员

发帖: 205粉丝: 16

级别 : 外部版主

发消息 + 关注

发表于2020年11月11日 19:05:20
直达本楼层的链接
沙发
显示全部楼层

数据库牛逼

点赞 评论 引用 举报

ares

发帖: 0粉丝: 0

级别 : 注册会员

发消息 + 关注

发表于2020年11月14日 14:06:59
直达本楼层的链接
板凳
显示全部楼层

点赞 评论 引用 举报

lte网络工程师

发帖: 164粉丝: 9

级别 : 外部版主

发消息 + 关注

发表于2020年11月14日 18:33:17
直达本楼层的链接
地板
显示全部楼层

删库跑路中的库

评论
运气男孩 2020-11-14 20:35 评论

rm-rf/

... 查看全部
点赞 评论 引用 举报

真爱无敌

发帖: 17粉丝: 8

级别 : 高级会员

发消息 + 关注

发表于2020年11月15日 10:01:30
直达本楼层的链接
5#
显示全部楼层

以前是:学好数理化,走遍天下都不怕

现在是:学号数据库,走遍天下都不怕

点赞 评论 引用 举报

游客

富文本
Markdown
您需要登录后才可以回帖 登录 | 立即注册