ぽ屋: 英文のPDFをGoogleのサービスで日本語に翻訳するTips

Google翻訳機能で海外製のソフトウェアのマニュアルのPDFファイルを翻訳しようとすると、十中八九……

……と表示され翻訳が出来ません。
対処法はケースバイケースですが……。

※記事最後の追記2のやり方が簡単でおススメです。そこだけ見ていただければ良いかと。

翻訳するページの枚数が少ない場合

そもそも、ページ数が少ない場合は問題なく翻訳出来るかと思いますが、ちょっと裏技的な英文の画像をOCRテキスト処理からの日本語への翻訳方法です。

PDFを画像として書き出し、Googleドライブ→Googleドキュメントで翻訳

AdobeAcrobatPro等でPDFを1ページ毎に画像として保存。画像をGoogleドライブへアップロードし、そこからGoogleドキュメントで開く。すると画像の英文がOCR処理されたテキストとして2ページ目に加えられた状態でファイルが開かれます。
そのファイルに、ツール＞ドキュメントを翻訳、日本語、と操作すると、ドキュメントのコピーとして英文のテキストが和訳されたドキュメントが作成されます。

こんな感じで。※著作権配慮でモザイク処理しています

これは読みやすいのですが、1ページごとに手作業の処理が発生するので翻訳枚数が10枚以上ある場合はちょっとやってられない感じです。OCR処理が無駄に入る為、テキストの正確さに若干、不安があります。手間だけ考えると、スマートフォンのカメラ翻訳アプリを使う方がマシかも。

翻訳するページの枚数が多い場合

はい。こちらがメインです。

やり方としては、

元のPDFをAdobeAcrobatPro等で30ページ程度毎に分割
分割したファイル毎にGoogle翻訳
翻訳ページをテキストエディタにコピー＆ペースト（HTML保存が失敗する場合がある為）

と、ただこれだけです。翻訳テキストのページ数の把握がしづらく少々難ありですが、翻訳の手間は少ない方だと思います。40ページ分の分割PDFにGoogleドキュメントでの翻訳を試したところ、なぜか25ページまでしか翻訳されませんでした。文字数が影響しているのかも。

メモ

大きいPDFファイルを一気に翻訳できるソフトやWEBサービス等、探せばあるかと思いますが、とりあえずは無料で利用できる、Googleのサービスでのやり方でした。
以前はZBRUSHの英語マニュアルPDFのテキストをコピー＆ペーストと改行修正の手作業で頑張って和訳していましたが、このやり方で大幅に手間を省けました。
また、スマートフォンのカメラ翻訳アプリが使えない場合でも、画像に含まれた英文をOCR処理経由で和訳する事も出来て便利です。

おまけ ZBrushのPDFを和訳した手順

Adobe Acrobat 8 Proを使用。

ページの上下の邪魔な部分をトリミング
ページ上部のロゴとページ数の表示してある部分が文章の翻訳に混ざって邪魔になるので表示されないようにトリミングする。
ツール＞高度な編集>トリミングツール、で残したい中央の部分を矩形選択し、ダブルクリックかエンターキーで決定。ページ範囲を”すべて”とする。
PDFを40ページ毎に分割
AdobeAcrobatProのサムネールウィンドウで40ページ分選択し、右クリックメニュー＞ページの抽出。分割して保存。
分割したPDFを一旦、DOCとして書き出し
PDFのままではトリミング部分の文字情報が残っており、Google翻訳時に本文に混ざって翻訳されてしまう。トリムを確定する処理として、一旦、Microsoft Wordファイルとして書き出す。ファイル＞書き出し＞Word文書
Google翻訳処理
Word文書形式で書き出した英文ファイルをGoogle翻訳。
翻訳されたテキストを保存
一度、通しで文章の最後までスクロールしないと全文が翻訳されないようなので、文末までスクロールし、全文が翻訳されたことを確認してから保存する。
HTML保存でなく翻訳文をコピー＆ペーストでテキストエディタなどワープロソフトに張り付けた方が自分で手直しが出来るのでおすすめ。

※追記
Acrobatの書き出しをHTMLとし、Google Chromeで開き、翻訳、とすると英文のHTMLを翻訳しつつ読むことができる。原文表示と和訳表示を切り替えられるので比較、確認出来て便利。

※追記2
ZBRUSH2018のPDFを和訳したので手順をメモ。

AcrobatPro8で英文PDFを開く。※無料で利用できる。→参考情報。
上下の邪魔な部分をトリミング。ツール＞高度な編集＞トリミング。
必要範囲を囲む＞ダブルクリック＞ページ範囲・全て
一旦すべてのページを抽出しないとHTML書き出しでトリミングが適用されないことがある。PDFのプロテクトで抽出が出来ない場合もある（お手上げ）。
書き出し＞PDF
（抽出した）PDFを分割せずHTML書き出し。
書き出し＞HTML
HTML化した英語ドキュメントをGoogleChromeで開き、翻訳する。一通りスクロール表示し全体の翻訳を確認。
保存。※オンラインで翻訳できる環境なら翻訳後に保存しなくても都度翻訳すれば良い。

ぽ屋

2017年7月14日金曜日

英文のPDFをGoogleのサービスで日本語に翻訳するTips

翻訳するページの枚数が少ない場合

翻訳するページの枚数が多い場合

メモ

おまけ ZBrushのPDFを和訳した手順

0 件のコメント:

コメントを投稿