<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<oembed>
  <version>1.0</version>
  <type>link</type>
  <title>Logbot | #g0v.tw | gugod&gt; 如果以檔案局那裡常看見的 pdf 的話，去掉雜點、切成一行字一個圖檔、再丟給 tesseract 抓字，這樣的 ocr 結果就好多了。不過感覺起來正確率好像也只有六、七成</title>
  <author_name>gugod</author_name>
  <provider_name>Logbot</provider_name>
  <provider_url>http://logbot</provider_url>
</oembed>
