我記得 tesserract 只是辨識字, 不負責 layout analyze