全文信息是指保存在數據庫中的記錄數據,包括結構化數據和非結構化數據。結構化數據是具有有限長度或固定格式的數據,如字符、日期、數值、貨幣等。非結構化數據也稱為全文數據,是以不定長、非固定格式保存的字符型數據,如簡歷、簡介、論文等。全文信息檢索是指從信息數據庫中檢索出相關信息資料的過程,其中關鍵是文檔的索引,即如何將源文檔中的信息以適當的形式記錄到索引庫中。全文檢索系統不僅要求將輸出信息進行相關性排列,還應能夠根據用戶的意圖、興趣和特點自適應和智能化地調整匹配機制,以獲得用戶滿意的檢索輸出。全文搜索引擎是通過建立從互聯網上提取的各個網站信息的數據庫,檢索與用戶查詢條件匹配的相關記錄,并按一定的排列順序將結果返回給用戶的工具。