Download DML ForTranslate Doc(DMLリファレンス Convert)
2024.03.13
DMLのドキュメントは800ページ近くあってPDFで配布されています。英語が母国語の場合はそれでよいのですが、母国語ではない場合に読むのが非常にきついです。
PDFの翻訳は可能ですが有料のものでないと800ページを1回で翻訳することは難しいですし、一番問題なのは専門用語があることで翻訳だけで読んでいるとわけがわからなく原文も読まないといけない。これがPDFだと厳しいです。
作者のcflagさんは、レイアウトが崩れるのが嫌がってWORDでドキュメント化してPDFに変換しています。そこはわからなくもないのですが・・・DMLの英語圏以外での普及が進みにくい原因の1つだと思います。
DML ForTranslate Doc
そこでPDFをレイアウトを維持したままHTMLに変換することで誤解を生まない形で変換することにしました。pdf2htmlでレイアウトを維持する代わりに、文字列の連続性が失われてしまいます。画像の回り込みやレイアウトの改行等で文章であったものが文字の塊になってしまうのが原因です。
cflagさんがレイアウトが同じになるようにドキュメントを書いているため、PDF2HTMLでの出力で失った文章をプログラムで再結合し、なるべくレイアウトを壊さない箇所に連結して格納。英語と異なり、日本語に翻訳した場合に文字幅の問題で翻訳テキストがオーバーフローするのを防ぐために、縦レイアウトを横レイアウトにし、図を右横に置くことでテキスト領域を稼ぐような仕様にしました
これにより、Chrome等のWebブラウザで表示し、必要に応じて翻訳、原文を切り替えることで翻訳時の可読性を高め、原文をみたいときにそのまま切り替えができるようにした出力が今回のものです。
ダウンロード
800ページ近くあり、画像も入っているためHTMLをそのまま表示するのではなく、zipでアーカイブしてダウンロード。ローカルで表示してもらうようにしました。ファイルが大きいのでなるべく高速な環境で読み込みたいのが理由です。
※テーブル変換の際にレイアウトが大きく崩れない場合には専用のCSSを入れていません。テーブルの枠が赤表示の部分となります。気になる箇所があったらページ番号を教えてください。サイズ合わせのCSSを追加します。
・DML Document V2_4_6(Convert 2025/04/05 88337KB)
・DML Document V2_2_0(Convert 2024/03/25 74135KB)
・DML Document V2_1_0(Convert 2024/03/12 76MB)
サンプル
実際にどのような出力になっているのかのサンプル画像です。オリジナル、For Translate Doc、翻訳後の3パターンのサンプルを以下に記します。
オリジナル




DML ForTranslate Docで変換したHTML




Chromeブラウザ等で翻訳をかける




このようにブラウザで翻訳<>原文を切り替えて読めるようになります。日本語は文字幅がありますのでそのまま翻訳すると文字が重なってしまうのでレイアウトを横長にし画像を右に退避させることで重なりにくいように調整してあります。