試了用 tesserract 來做中文 OCR -- 如果 pdf 一頁一頁轉成圖檔的的話真是大悲劇,不過手動把字一行行成較小的圖檔的話卻又不錯