在 hocr 輸出裡的 .ocr_line html tag 確實是包住直書的一行。這就還不賴了。