百度搜索引擎結(jié)果的緩存機(jī)制是指什么
緩存就是臨時(shí)文件互換區(qū),是可以開展高速數(shù)據(jù)交換的存儲(chǔ)器,它先于內(nèi)存與CPU互換統(tǒng)計(jì)數(shù)據(jù),因而速度很快。如今以便加速客戶查詢的響應(yīng)速度,緩存基本上變成百度搜索引擎的標(biāo)準(zhǔn)配置。搜索引擎會(huì)把一些客戶常常檢索的關(guān)鍵詞的搜索放進(jìn)到緩存中,那樣當(dāng)該關(guān)鍵詞再度被搜索時(shí),就可以立即從內(nèi)存中讀取搜索結(jié)果,而無(wú)須再?gòu)乃饕龓?kù)中開展再次查找和排行。緩存體制的導(dǎo)入,不但加速了搜索引擎對(duì)用戶搜索的反應(yīng)速度,也降低了搜索引擎對(duì)數(shù)據(jù)的反復(fù)測(cè)算。
用戶的搜索請(qǐng)求中,少數(shù)查詢?cè)~占了查詢總數(shù)量的相當(dāng)大的占比,而大部分查詢?cè)~單獨(dú)出現(xiàn)的頻次都很少,類似長(zhǎng)尾理論。因而搜索引擎把用戶常常查尋的“少量”關(guān)鍵詞的搜索結(jié)果儲(chǔ)放于緩存中,就可以解決大部分用戶的搜索請(qǐng)求了。整個(gè)搜索引擎的緩存體制中還會(huì)涉及到緩存淘汰和緩存更新體制。
由于搜索引擎的緩存也并不是無(wú)限的,毫無(wú)疑問也有載滿的時(shí)候,這時(shí)就必須有效的淘汰體制,把應(yīng)用頻率小的搜索去除,填補(bǔ)進(jìn)來(lái)應(yīng)用頻率大的搜索結(jié)果,來(lái)確保緩存文件中的內(nèi)容可以響應(yīng)及命中當(dāng)下盡量多的用戶搜索請(qǐng)求。同時(shí)網(wǎng)頁(yè)和索引庫(kù)中的文檔內(nèi)容隨之時(shí)間的轉(zhuǎn)變也會(huì)進(jìn)而變化,以便促使緩存中的結(jié)果和網(wǎng)頁(yè)同步,這時(shí)就必須有效的緩存更新體制。
這解釋一下緩存更換體制:百度搜索引擎以便節(jié)約資源,并不是對(duì)緩存中的內(nèi)容開展實(shí)時(shí)更新,只是會(huì)挑選在深夜等搜索請(qǐng)求較為少的時(shí)間范圍開展更新緩存,因此用戶在不一樣時(shí)間搜索相同關(guān)鍵詞獲得的結(jié)果將會(huì)是不一樣的,可是通常在較短期內(nèi)的反復(fù)搜索會(huì)獲得同樣的搜索。如今的搜素引擎會(huì)分析搜索關(guān)鍵詞的特性,并依據(jù)搜索關(guān)鍵詞的特性調(diào)節(jié)緩存的更新頻率,例如,如今百度搜索的“最新基本信息”“最新有關(guān)微博”等實(shí)用性搜索的緩存更新頻率和一般詞緩存更新的頻率毫無(wú)疑問是不一樣的。必須表明的是,如今大型搜索引擎的緩存并不是簡(jiǎn)單地直接緩存文件關(guān)鍵詞的搜索結(jié)果,而是有著很繁雜的緩存結(jié)構(gòu)和統(tǒng)計(jì)數(shù)據(jù),通常是多級(jí)結(jié)構(gòu)的,一起提高百度搜索引擎的響應(yīng)速度和緩存數(shù)據(jù)的命中率范疇。