垂直搜索引擎和原搜索引擎的最大區別是對網頁信息進行了結構化信息抽取,也就是將網頁的非結構化數據抽取成特定的結構化信息數據,好比網頁搜索是以網頁為最小單位,基於視覺的網頁塊分析是以網頁塊為最小單位,而垂直搜索是以結構化數據為最小單位。
然後將這些數據存儲到數據庫,進行進一步的加工處理,如:去重、分類等,最後分詞、索引再以搜索的方式滿足用户的需求。