您當前的位置:搜索引擎大全 > 搜索引擎動態 >

傳媒人士眼中的"搜索引擎"(一)

  • 作者:搜索引擎優化 發布時間 2015-11-10 15:54 來源 搜索引擎大全
  •   zhoublog:周博在之后會發布"傳媒人士眼中的"搜索引擎"系列文章,讓大家了解下非專業人士或者說他人從另一個角度怎么去看待搜索引擎的,或許較之我們更為公平公正點.

      搜索引擎概述及主流搜索引擎的發展回顧

      搜索引擎是因信息檢索的需要而發展起來的。

      傳統書箱里的目錄、索引其實就是紙張上的搜索,帶領讀者到哪頁看什么內容。搜索引擎的目的跟它們在本質上是一致的。剛開始的搜索引擎還不是電子化的,也不是專門的關健詞檢索,但是依然自然而然地被人們應用,到后來有了計算機、電子數據,我們就通過計算機完成這種原本靠翻閱書籍完成的搜索。計算機大約有五六十年的歷史,信息檢索的發展也隨其經歷了不同的發展階段。初期,例如同學們人學時的姓名、年齡,出生地等信息,這些信息是高度結構化的。所謂高度結構化,就是組織得很好的(信息)。但是后來,隨著電子化的信息越來越多,比如網頁,雖然它也有題目、內容等,但事實上巳經沒有結構了。隨著數據量的增長,它的結構就呈現非結構化特點,接著便出現了全文的數據檢索,在互聯網上的表現就是出現了搜索引擎。

      互聯網剛出現時,即便是專業人員都很少會用。首先出現的是對FTP文件進行搜索的Arhie,那個時候,網絡對中國人來說是很遙遠的事情,更多的是美國人在用。1996年我還在讀書的時候,互聯網剛剛進入中國不久,我們老師在講座上跟我們講,他發了份電子郵件,第二天就收到美國的回信.我們感覺好神奇啊!到1998, 1999年,我們開始擁有了Yahoo,那時的搜索引擎是這樣的,Yahoo公司每天給互聯網上的網站發郵件,說,"您好,我是個搜索引擎,代表Yahoo公司要把您這個網站搜到我的目錄里面。”,那時互聯網上的信息還不是特別豐富,通過人工處理把各類網站分類放到總的目錄里面。Yahoo剛開始的搜素引擎就是這種概念,目錄也僅是網站的目錄而已,而且是Yahoo追在別人后面說."請您允許我把你的網站加到我的目錄里來”。但是我們也可以看到雖然那時互聯網上信息匱乏,但搜索引擎已經開始呈現雛形了。隨著互聯網上信息越來越豐富。人工處理方式越趨落后,于是出現了采用自動抓取排序的攫索引擎.也就是目前主流的搜索引擎模式,比如大家熟知的Google和百度。作為專業公司,它們不僅滿足于我們通過輸人關鍵詞得出結果,同時,也在嘗試新的發展以更加符合用戶胃口的搜索,即所謂的搜索智能化。但是根據我對智能化的理解,從計算機自動處理角度而言的智能化,路途還是非常遙遠的,在可預見的將來,尚不大切合實際。搜索引擎下一階段更有可能的發展模式是社區化,即互聯網用戶的主動參與。就像百度里面的貼吧、同答一類。互聯網鼓勵大家積極參與,但這種鼓勵僅僅是局限于公司內部給予的獎勵。互聯網要想智能化、符合更多人的需求,就需要大眾的積極參與,需要通過合理而行之有效的激勵手段去鼓勵大家來參與搜索。

      搜索引擎的發展階段

      雛形階段(互聯網初創).

      Archie(提供FTp文件的查找服務)

      人工分類階段(WWW網開始流行)

      Yahoo. AltaVista, Infoseek

      自動抓取排序階段(日前主流)

      Google,Baidu

      個性化智能搜索階段(未來發展)

      社區化

      我們主要講的是第三個階段,就是目前我們大部分人用的自動抓取排序階段的搜索引擎.可以以Google和百度為代表。

      搜索引擎從廣義而言有很多種,分類方式也各不相同。按使用方式可以分為:目錄式、爬蟲式,元搜索;按搜索范圍可以分為:全網通用、垂直、企業;按信息類型可分為:文本、音樂、視頻、圖像等。

      目錄式搜索是分類的,是一級一級的,包括大類小類這樣分下去。像Yahoo現在已經基本摒棄了,但經常用百度的人會注意到,百度現在又把"hao123"這個網站掛上去了。因為物極必反,目錄搜索這種東西,起先因為本身的局限性而被淘汰,但是在大家使用關鍵詞進行搜索一陣子后,又感到目錄搜索有它存在的必要,即使它只是處于輔助或次要的地位。像OpenDirectory Project這個目錄至今為止還是被廣泛應用,尤其是專業用戶,可見它還是很有著強勁生命力的。

      爬蟲式搜索是日前主流的搜索方式。現在我們搜索信息的主要類型還是文本,像音樂、視頻、圖像等多媒體.本質上也是文本的搜索引擎。不通過文本的、直接的搜索,目前是非常不成熟的,大家也很少用到。爬蟲式搜索引擎比較多,有幾十個甚至上百個都不同為奇,只是我們常用的只有很少的幾個。事實上幾乎每個搜索引擎公司都以搜索引擎起家,但隨著業務的發展提供的服務也越來越多。像Google,現在也提供以搜家引擎為核心的越來越多的網絡產品供大家使用。但事實上我們所關注的和它自己本身,都依舊是以搜索引擎為核心的。

      說到元搜素,可以舉一個例子,我們輸入關鍵詞:浙江傳映學院。它出來的結果是將百度、Yahoo, Google等等搜索引擎的結果整合在一起進行包裝的,然后作為一個總的結果反饋出來,這就是元搜索。此類的搜索引擎很容易創建,只要把百度、Yahoo、Google等調用作為自己的結果即可,同時它對結果的處理能力有限,比較簡單。

      傳媒人士眼中的"搜索引擎"(二)

      傳媒人士眼中的"搜索引擎"(三)

? bf1234网球比分直播