直播中
一、什么是信息源?
信息源,是指通過某種物質(zhì)傳出去的信息的發(fā)源地。
兩點(diǎn)需要注意:一是某種物質(zhì)傳出去,二是信息發(fā)源地。
聯(lián)合國教科文組織1976年出版的《文獻(xiàn)術(shù)語》一書將信息源定義為:
個(gè)人為滿足其信息需要而獲得信息的來源,稱信息源。一切產(chǎn)生、生產(chǎn)、存貯、加工、 傳播信息的源泉都可以看作是信息源。
二、XML是什么?
XML,英文全稱為“eXtensible Markup Language”,中文譯為“可擴(kuò)展標(biāo)記語言”,是一種簡單的數(shù)據(jù)存儲語言。
XML的優(yōu)勢有很多,比如簡單易于掌握和使用,專注傳輸數(shù)據(jù),表現(xiàn)行為及其簡單,在很多應(yīng)用程序中都可以使用(不僅僅是網(wǎng)站的xml地圖)等。
對于網(wǎng)站優(yōu)化而言,我們對于XML的認(rèn)識基本上是停留在XML地圖上,制作一個(gè)XML地圖,然后提交至百度、360、搜狗(部分站點(diǎn)才有)、Google、神馬等搜索引擎平臺,這樣可以讓網(wǎng)站被搜索引擎被充分地收錄。
三、XML是搜索引擎信息源的標(biāo)準(zhǔn)數(shù)據(jù)格式
① XML網(wǎng)站地圖
對于網(wǎng)絡(luò)爬蟲而言,其任務(wù)是努力爬行發(fā)現(xiàn)更多有價(jià)值的內(nèi)容和發(fā)生變化的已收錄的頁面,然而對于搜索引擎而言會(huì)更加期望僅通過監(jiān)測信息源,就能夠發(fā)現(xiàn)新的頁面,那么這個(gè)效果就是XML網(wǎng)站地圖。
搜狗搜索引擎對XML網(wǎng)站地圖的提交進(jìn)行了限制,只有符合一定條件(通常是規(guī)模和質(zhì)量)的網(wǎng)站才有資格提交sitemap網(wǎng)站地圖(即xml地圖),其他搜索引擎都是提倡大家提倡XML網(wǎng)站地圖的。
② RSS閱讀器(RSS feed)
對于互聯(lián)網(wǎng)信息源而言,除了XML網(wǎng)站地圖提交給搜索引擎,另外一個(gè)通用標(biāo)準(zhǔn)格式即為RSS。人們可以使用RSS閱讀器訂閱網(wǎng)站的RSS信息源,就可以直接獲取RSS信息源網(wǎng)站的最新文章了。
其實(shí)RSS就是采用了XML數(shù)據(jù)格式來傳遞數(shù)據(jù)的,網(wǎng)站只要有RSS接口(feed),就可以成為一個(gè)RSS的信息源。