首页 > 数据库 >了解一下 Technorati 的后台数据库架构

了解一下 Technorati 的后台数据库架构

时间:2023-03-28 14:04:42浏览次数:48  
标签:Web 架构 数据库 Technorati MyISAM MySQL 数据


Technorati (现在被阻尼了, 可能你访问不了)的 Dorion Carroll在 2006 MySQL 用户会议上介绍了一些关于 Technorati 后台数据库架构的情况.

基本情况

目前处理着大约 10Tb 核心数据, 分布在大约 20 台机器上.通过复制, 多增加了 100Tb 数据, 分布在 200 台机器上. 每天增长的数据 1TB. 通过 SOA 的运用, 物理与逻辑的访问相隔离, 似乎消除了数据库的瓶颈. 值得一提的是, 该扩展过程始终是利用普通的硬件与开源软件来完成的. 毕竟 , Web 2.0 站点都不是烧钱的主. 从数据量来看,这绝对是一个相对比较大的 Web 2.0 应用.

Tag 是 Technorati 最为重要的数据元素. 爆炸性的 Tag 增长给 Technorati 带来了不小的挑战.

2005 年 1 月的时候, 只有两台数据库服务器, 一主一从. 到了 06 年一月份, 已经是一主一从, 6 台 MyISAM 从数据库用来对付查询, 3 台 MyISAM 用作异步计算.

一些核心的处理方法:

1) 根据实体(tags/posttags))进行分区

衡量数据访问方法,读和写的平衡.然后通过不同的维度进行分区.( Technorati 数据更新不会很多, 否则会成为数据库灾难)

2) 合理利用 InnoDB 与 MyISAM

InnoDB 用于数据完整性/写性能要求比较高的应用. MyISAM 适合进行 OLAP 运算. 物尽其用.

3) MySQL 复制

复制数据到从主数据库到辅数据库上,平衡分布查询与异步计算, 另外一个功能是提供冗余. 如图:

标签:Web,架构,数据库,Technorati,MyISAM,MySQL,数据
From: https://blog.51cto.com/u_2650279/6154718

相关文章

  • NeuroDB图数据库引擎 发布,一款全自主研发的国产图数据库引擎
    NeuroDB是一个内存级图数据库引擎,能够利用Neuro-cypher指令实现对图数据的创建、编辑、检索以及建立在复杂图算法上的一些高级图应用。NeuroDB的主要特性为:轻量级:整个......
  • RS485采集电表DLT645-1997/2007协议数据存入数据库方案
    DAQforIIOT通用工业数据采集系统是一套运行在边缘计算机、工业网关或普通电脑上的设备数据采集管理软件,主要用于对各种工业仪器设备、电表、PLC、注塑机、数控机床等数据......
  • Node.js开发手册(四)-Redis数据库访问
    Node.js开发手册(四)-Redis数据库访问作者:chszs,转载需注明。因工作太忙,本系列的文章中断了很久,现在有机会继续了。大家要记住,Node.js主要用于构建高性能、高可伸缩性的服务器......
  • 数据库事务
    什么是数据库事务Postedonlzhdim数据库事务是指作为单个逻辑工作单元执行的一系列操作。设想网上购物的一次交易,其付款过程至少包括以下几步......
  • Hibernate 子类中不能用session 操作数据库
    Objectobj=this.getHibernateTemplate().execute(newHibernateCallback(){publicObjectdoInHibernate(Sessionsession)throwsHibernateExcep......
  • SQL.js -- 操作sqlite数据库
    js读写sqliteJavaScript是一种在浏览器中运行的脚本语言,无法直接读写SQLite数据库。不过,你可以使用一些JavaScript库或框架来操作SQLite数据库,例如SQLite.js和......
  • Spring中使用JdbcTemplate操作数据库
    JDBC是Java提供的一种用于执行SQL语句的API,可以对多种关系型数据库(例如MySQL、Oracle等)进行访问。但在实际的企业级应用开发中,却很少有人直接使用原生的JDBCAPI......
  • 基于CNN卷积神经网络的minst数据库手写字识别matlab仿真
    1.算法描述深度学习(DL,DeepLearning)是机器学习(ML,MachineLearning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI,ArtificialIn......
  • DB2重启数据库实例
    DB2重启数据库实例时,有时停止实例会失败,此时需要先确认没有应用链接数据库,然后再关闭数据库实例,并重新启动。1.查看是否有活动的链接命令:db2listapplicati......
  • IFIT 的架构与功能
    随路网络测量需要在网络设备上指定被监控的流对象,并分配对应的监控资源,用于在报文中插入数据收集指令、收集数据、剥离指令和数据等。受限于处理能力,网络设备只能监控有限规......