一、問(wèn)題:
? ? ?
? ??數(shù)據(jù)庫(kù)表數(shù)據(jù)量極大(千萬(wàn)條),要求讓服務(wù)器更加快速地響應(yīng)用戶的需求。
?
二、解決方案:
? ? ?1.通過(guò)高速服務(wù)器Cache緩存數(shù)據(jù)庫(kù)數(shù)據(jù)
? ? ?2.內(nèi)存數(shù)據(jù)庫(kù)
?
? (這里僅從數(shù)據(jù)緩存方面考慮,當(dāng)然,后期可以采用Hadoop+HBase+Hive等分布式存儲(chǔ)分析平臺(tái))
三、主流解Cache和數(shù)據(jù)庫(kù)對(duì)比:
?
? ? ?上述技術(shù)基本上代表了當(dāng)今在數(shù)據(jù)存儲(chǔ)方面所有的實(shí)現(xiàn)方案,其中主要涉及到了普通關(guān)系型數(shù)據(jù)庫(kù)(MySQL/PostgreSQL),NoSQL數(shù)據(jù)庫(kù)(MongoDB),內(nèi)存數(shù)據(jù)庫(kù)(Redis),內(nèi)存Cache(Memcached),我們現(xiàn)在需要的是對(duì)大數(shù)據(jù)表仍保持高效的查詢速度,普通關(guān)系型數(shù)據(jù)庫(kù)是無(wú)法滿足的。而MongoDB其實(shí)只是一種非關(guān)系型數(shù)據(jù)庫(kù),其優(yōu)勢(shì)在于可以存儲(chǔ)海量數(shù)據(jù),具備強(qiáng)大的查詢功能,因此不宜用于緩存數(shù)據(jù)的場(chǎng)景。
?
? ? ? ?從以上各數(shù)據(jù)可知,對(duì)于我們產(chǎn)品最可行的技術(shù)方案有兩種:
? ? ? ? ?1.Memcached?? ? ? ? 內(nèi)存Key-Value Cache
? ? ? ? ?2.Redis?? ? ? ? ? ? ? ? ? ? 內(nèi)存數(shù)據(jù)庫(kù)
?
四、下面重點(diǎn)分析Memcached和Redis兩種方案:
?
4.1?Memcached介紹??
?
? ? ?Memcached?是一個(gè)高性能的分布式內(nèi)存對(duì)象緩存系統(tǒng),用于動(dòng)態(tài)Web應(yīng)用以減輕數(shù)據(jù)庫(kù)負(fù)載。它通過(guò)在內(nèi)存中緩存數(shù)據(jù)和對(duì)象來(lái)減少讀取數(shù)據(jù)庫(kù)的次數(shù),從而提供動(dòng)態(tài)、數(shù)據(jù)庫(kù)驅(qū)動(dòng)網(wǎng)站的速度,現(xiàn)在已被LiveJournal、hatena、Facebook、Vox、LiveJournal等公司所使用。
?
4.2?Memcached工作方式分析
? ? ?
? ? ?許多Web應(yīng)用都將數(shù)據(jù)保存到 RDBMS中,應(yīng)用服務(wù)器從中讀取數(shù)據(jù)并在瀏覽器中顯示。?但隨著數(shù)據(jù)量的增大、訪問(wèn)的集中,就會(huì)出現(xiàn)RDBMS的負(fù)擔(dān)加重、數(shù)據(jù)庫(kù)響應(yīng)惡化、?網(wǎng)站顯示延遲等重大影響。Memcached是高性能的分布式內(nèi)存緩存服務(wù)器,通過(guò)緩存數(shù)據(jù)庫(kù)查詢結(jié)果,減少數(shù)據(jù)庫(kù)訪問(wèn)次數(shù),以提高動(dòng)態(tài)Web等應(yīng)用的速度、?提高可擴(kuò)展性。下圖展示了memcache與數(shù)據(jù)庫(kù)端協(xié)同工作情況:
?
? ? ?
? ? ?其中的過(guò)程是這樣的:
? ? ? ? ? ?1.檢查用戶請(qǐng)求的數(shù)據(jù)是緩存中是否有存在,如果有存在的話,只需要直接把請(qǐng)求的數(shù)據(jù)返回,無(wú)需查詢數(shù)據(jù)庫(kù)。
? ? ? ? ? ?2.如果請(qǐng)求的數(shù)據(jù)在緩存中找不到,這時(shí)候再去查詢數(shù)據(jù)庫(kù)。返回請(qǐng)求數(shù)據(jù)的同時(shí),把數(shù)據(jù)存儲(chǔ)到緩存中一份。
? ? ? ? ? ?3.保持緩存的“新鮮性”,每當(dāng)數(shù)據(jù)發(fā)生變化的時(shí)候(比如,數(shù)據(jù)有被修改,或被刪除的情況下),要同步的更新緩存信息,確保用戶不會(huì)在緩存取到舊的數(shù)據(jù)。
? ? ?Memcached作為高速運(yùn)行的分布式緩存服務(wù)器,具有以下的特點(diǎn):?
-
- 協(xié)議簡(jiǎn)單?
- 基于libevent的事件處理?
- 內(nèi)置內(nèi)存存儲(chǔ)方式
- memcached不互相通信的分布式
?
4.3 如何實(shí)現(xiàn)分布式可拓展性?
?
? ? ?Memcached的分布式不是在服務(wù)器端實(shí)現(xiàn)的,而是在客戶端應(yīng)用中實(shí)現(xiàn)的,即通過(guò)內(nèi)置算法制定目標(biāo)數(shù)據(jù)的節(jié)點(diǎn),如下圖所示:
4.4?Redis 介紹 ?
?
? ? ?Redis是一個(gè)key-value存儲(chǔ)系統(tǒng)。和Memcached類似,它支持存儲(chǔ)的value類型相對(duì)更多,包括string(字符串)、 list(鏈表)、set(集合)和zset(有序集合)。這些數(shù)據(jù)類型都支持push/pop、add/remove及取交集并集和差集及更豐富的操作,而且這些操作都是原子性的。在此基礎(chǔ)上,redis支持各種不同方式的排序。與memcached一樣,為了保證效率,數(shù)據(jù)都是緩存在內(nèi)存中。區(qū)別的是redis會(huì)周期性的把更新的數(shù)據(jù)寫入磁盤或者把修改操作寫入追加的記錄文件,并且在此基礎(chǔ)上實(shí)現(xiàn)了master-slave(主從)同步,當(dāng)前 Redis的應(yīng)用已經(jīng)非常廣泛,國(guó)內(nèi)像新浪、淘寶,國(guó)外像?Flickr、Github等均在使用Redis的緩存服務(wù)。
?
4.5?Redis?工作方式分析
?
? ? ?Redis作為一個(gè)高性能的key-value數(shù)據(jù)庫(kù)具有以下特征:?
-
- 多樣的數(shù)據(jù)模型?
- 持久化?
- 主從同步 ?
? ? ?Redis支持豐富的數(shù)據(jù)類型,最為常用的數(shù)據(jù)類型主要由五種:String、Hash、List、Set和Sorted?Set。Redis通常將數(shù)據(jù)存儲(chǔ)于內(nèi)存中,或被配置為使用虛擬內(nèi)存。Redis有一個(gè)很重要的特點(diǎn)就是它可以實(shí)現(xiàn)持久化數(shù)據(jù),通過(guò)兩種方式可以實(shí)現(xiàn)數(shù)據(jù)持久化:使用RDB快照的方式,將內(nèi)存中的數(shù)據(jù)不斷寫入磁盤;或使用類似MySQL的AOF日志方式,記錄每次更新的日志。前者性能較高,但是可能會(huì)引起一定程度的數(shù)據(jù)丟失;后者相反。 Redis支持將數(shù)據(jù)同步到多臺(tái)從數(shù)據(jù)庫(kù)上,這種特性對(duì)提高讀取性能非常有益。
? ? ?
4.6 Redis如何實(shí)現(xiàn)分布式可拓展性?
?
2.8以前的版本:與Memcached一致,可以在客戶端實(shí)現(xiàn),也可以使用代理,twitter已開發(fā)出用于Redis和Memcached的代理Twemproxy?。
3.0 以后的版本:相較于Memcached只能采用客戶端實(shí)現(xiàn)分布式存儲(chǔ),Redis則在服務(wù)器端構(gòu)建分布式存儲(chǔ)。Redis?Cluster是一個(gè)實(shí)現(xiàn)了分布式且允許單點(diǎn)故障的Redis高級(jí)版本,它沒(méi)有中心節(jié)點(diǎn),各個(gè)節(jié)點(diǎn)地位一致,具有線性可伸縮的功能。如圖給出Redis?Cluster的分布式存儲(chǔ)架構(gòu),其中節(jié)點(diǎn)與節(jié)點(diǎn)之間通過(guò)二進(jìn)制協(xié)議進(jìn)行通信,節(jié)點(diǎn)與客戶端之間通過(guò)ascii協(xié)議進(jìn)行通信。在數(shù)據(jù)的放置策略上,Redis?Cluster將整個(gè) key的數(shù)值域分成16384個(gè)哈希槽,每個(gè)節(jié)點(diǎn)上可以存儲(chǔ)一個(gè)或多個(gè)哈希槽,也就是說(shuō)當(dāng)前Redis?Cluster支持的最大節(jié)點(diǎn)數(shù)就是16384
?
? ? ?
?
五、綜合結(jié)論
?
? ?
?應(yīng)該說(shuō)Memcached和Redis都能很好的滿足解決我們的問(wèn)題,它們性能都很高,總的來(lái)說(shuō),可以把Redis理解為是對(duì)Memcached的拓展,是更加重量級(jí)的實(shí)現(xiàn),提供了更多更強(qiáng)大的功能。具體來(lái)說(shuō):
?
1.性能上:
? ? ?性能上都很出色,具體到細(xì)節(jié),由于Redis只使用單核,而Memcached可以使用多核,所以平均每一個(gè)核上Redis在存儲(chǔ)小數(shù)據(jù)時(shí)比
Memcached性能更高。而在100k以上的數(shù)據(jù)中,Memcached性能要高于Redis,雖然Redis最近也在存儲(chǔ)大數(shù)據(jù)的性能上進(jìn)行優(yōu)化,但是比起?Memcached,還是稍有遜色。
?
2.內(nèi)存空間和數(shù)據(jù)量大小:
? ? ?MemCached可以修改最大內(nèi)存,采用LRU算法。Redis增加了VM的特性,突破了物理內(nèi)存的限制。
?
3.操作便利上:
? ? ?MemCached數(shù)據(jù)結(jié)構(gòu)單一,僅用來(lái)緩存數(shù)據(jù),而Redis支持更加豐富的數(shù)據(jù)類型,也可以在服務(wù)器端直接對(duì)數(shù)據(jù)進(jìn)行豐富的操作,這樣可以減少網(wǎng)絡(luò)IO次數(shù)和數(shù)據(jù)體積。
?
4.可靠性上:
? ? ?MemCached不支持?jǐn)?shù)據(jù)持久化,斷電或重啟后數(shù)據(jù)消失,但其穩(wěn)定性是有保證的。Redis支持?jǐn)?shù)據(jù)持久化和數(shù)據(jù)恢復(fù),允許單點(diǎn)故障,但是同時(shí)也會(huì)付出性能的代價(jià)。
?
5.應(yīng)用場(chǎng)景:
? ? ?Memcached:動(dòng)態(tài)系統(tǒng)中減輕數(shù)據(jù)庫(kù)負(fù)載,提升性能;做緩存,適合多讀少寫,大數(shù)據(jù)量的情況(如人人網(wǎng)大量查詢用戶信息、好友信息、文章信息等)。
? ? ?Redis:適用于對(duì)讀寫效率要求都很高,數(shù)據(jù)處理業(yè)務(wù)復(fù)雜和對(duì)安全性要求較高的系統(tǒng)(如新浪微博的計(jì)數(shù)和微博發(fā)布部分系統(tǒng),對(duì)數(shù)據(jù)安全性、讀寫要求都很高)。
?
六、需要慎重考慮的部分
?
1.Memcached單個(gè)key-value大小有限,一個(gè)value最大只支持1MB,而Redis最大支持512MB
2.Memcached只是個(gè)內(nèi)存緩存,對(duì)可靠性無(wú)要求;而Redis更傾向于內(nèi)存數(shù)據(jù)庫(kù),因此對(duì)對(duì)可靠性方面要求比較高
3.從本質(zhì)上講,Memcached只是一個(gè)單一key-value內(nèi)存Cache;而Redis則是一個(gè)數(shù)據(jù)結(jié)構(gòu)內(nèi)存數(shù)據(jù)庫(kù),支持五種數(shù)據(jù)類型,因此Redis除單純緩存作用外,還可以處理一些簡(jiǎn)單的邏輯運(yùn)算,Redis不僅可以緩存,而且還可以作為數(shù)據(jù)庫(kù)用
4.新版本(3.0)的Redis是指集群分布式,也就是說(shuō)集群本身均衡客戶端請(qǐng)求,各個(gè)節(jié)點(diǎn)可以交流,可拓展行、可維護(hù)性更強(qiáng)大。
來(lái)自:http://blog.csdn.net/suifeng3051/article/details/23739295
分類:?數(shù)據(jù)庫(kù)
本文摘自 :https://blog.51cto.com/u