【初心者スレ】Ubuntu Linux 52at LINUX
【初心者スレ】Ubuntu Linux 52 - 暇つぶし2ch380:login:Penguin
10/06/05 01:15:08 JfmbJ71m
hyper estraierを使っていて、日本語、英語のpdfが途中までしかテキスト化されてませんでした.
スレリンク(unix板:138-149番)
やられているとおり
estfxpdftohtml の中の
pdftotext -enc UTF-8 -htmlmeta "$infile" - 2> "/dev/null" | output を
pdftotext -enc UTF-8 -raw -nopgbrk "$infile" - 2> "/dev/null" | output
として 2カラム ページ情報捨てるestfxpdftotextという名前でコピーし
estcmd gather -cl -fx ".pdf" "T@estfxpdftotext" -fz -ic UTF-8 -pc UTF-8 -il ja -lf -1 -lt -1 -sd -cm casket ~/PDFDIR
とやってみました
hyper estraierを使ってPDFを十分に引っかけられている人はいますか?


次ページ
続きを表示
1を表示
最新レス表示
レスジャンプ
類似スレ一覧
スレッドの検索
話題のニュース
おまかせリスト
オプション
しおりを挟む
スレッドに書込
スレッドの一覧
暇つぶし2ch