輸入計算機的漢字,無論是從鍵盤上用編碼建築的,或者是通過漢字自動識別輸入的,最終都必須由內碼錶示
詞與詞之間沒有任何的區分標誌,然而在信息處理許多重要領域中,例如機器翻譯,自然語言理解,文獻檢索等平行上進行的這一平面上,是可以想象的,為了能夠在此這一平面上進行中文信息處理,必須把等距排列的漢字串序列按詞切分開來打勝區分標誌,使得漢字自串序列轉換成詞串序列就是自動分詞