翻訳ボリュームのカウント方法について

翻訳ボリュームのカウント方法についてボリュームとは、翻訳が必要なドキュメント(文書:以降、”原稿”とします)に含まれる文字数や単語数のことを言います。

翻訳単価」「その他料金」とともに翻訳料金を決定付ける三大要素のひとつである「ボリューム」は、どのようにして数えるのでしょうか。

本記事では、翻訳会社が行なうボリュームカウント方法について解説します。

※翻訳料金を構成するひとつであるボリュームですが、

 

  • 原文ベース(翻訳前の文字数または、単語数を基準とする場合)
  • 仕上がりベース(翻訳後の文字数または、単語数を基準とする場合)

の二通りのカウント方法が存在します。これらの詳細については別の記事でご紹介しますが、本記事では「原文ベース」を前提としています。

原稿が紙媒体のテキストの場合

手作業でカウントする

もっともシンプルな方法は、一文字ずつまたは、1単語ずつ手作業で数えるというものです。

1ページずつ丁寧に数えて正確なボリュームを確認するのが理想ですが、冊子など出版物の場合はページ数も多くその作業に掛かる時間も膨大なものとなります。よって、次のような方法でラフに算出する場合もあります。

一列に含まれる文字数または、一行に含まれる単語数 × 1ページあたりの行数 × 全ページ数

「ラフなカウントだと文字数または、単語数が実際とは異なり、翻訳料金が変わってしまう(依頼主が損をする)のでは?」といった懸念が生じると思いますが、ラフにカウントする場合でも「空白の多い、少ない」によって何種類かのページ構成に分けてカウントするなど、正確にカウントした結果と大きく変わらないように工夫しています。

OCRソフトを使ってカウントする

前述のとおり、手作業によるボリュームカウントは膨大な時間を費やします。そこで使用するのがOCRソフトです。

OCRとは、Optical Character RecognitionまたはReaderの略であり、通称「オーシーアール」と呼ばれる光学的文字認識技術です。OCRソフトとはその技術を用いた文字読み取りソフトウェアのことであり、豊富なラインナップで各社から販売されています。

OCRソフトを用いて紙媒体を電子ファイル形式のテキストに変換することにより、Microsoft Wordなどの「文字カウント機能」を使って容易にボリュームがカウントできるようになる、というわけですが時間削減の点で大きな効果を発揮するカウント方法です。

ただし、文字の読み取り精度が各社各ソフトによって異なること、また、印鑑などが重なった文字、手書きの文字、濃い背景色の上に載った文字などは、どのソフトを使っても読み取りが難しい場合がありますので、読み取った結果(内容)をよく確認する作業が必要となります。

原稿がPDFファイル形式のテキストの場合

テキストのコピー&ペーストができる場合

Microsoft、Appleその他各社のソフトウェアである文章作成ソフト、表計算ソフト、プレゼンテーションソフトなどで作成した電子ファイルをPDFに出力したものは、コピーガードで保護されていない場合を除きコピー&ペーストすることができます。

コピー&ペーストできるかできないかは、PDFファイルを開いた状態で「Ctrl+A」で「全範囲選択」した際にテキスト部分が反転表示されるかどうかをみればすぐに判別できます。

テキストがコピー&ペーストできる場合は、コピーしたものをMicrosoft Wordファイル上にペースト(貼り付け)し、あとは同ソフトの「文字カウント機能」用いてボリュームを簡単にカウントすることができます。

文字カウント機能

文字カウント結果

文字カウントについてはMicrosoft Wordにかぎらず、テキストエディタ(ソフトウェア)に標準装備の機能やWebサイト上の無料ツールで行なうこともできますが、セキュリティ面もよく考えて行なうようにしましょう。

テキストのコピー&ペーストができない場合

紙媒体のものをスキャンした場合や、画像化されたテキストまたは、コピーガード(コピー防止)設定されたPDFファイル形式のテキストはコピー&ペーストができません。このような場合は前述の紙媒体と同じ方法(手計算もしくは、OCRソフト)でボリュームをカウントしましょう。

コピーガード(コピー防止)設定についてはもちろん、ファイル管理者もしくは、提供者に解除を依頼することも考えましょう。

原稿がMicrosoft Wordファイル形式のテキストの場合

原稿がテキストだけの場合

原稿がテキスト(文字)だけで構成されている場合はそのまま、Microsoft Wordの「文字カウント機能」を用いて簡単に、瞬時にボリュームをカウントすることができます。

原稿にテキストボックスが含まれる場合

原稿にテキストボックスが挿入されていると、テキストボックス内のテキストはMicrosoft Wordの「文字カウント機能」ではカウントすることができません。このような場合は、Microsoft Wordファイルを一旦PDFファイル形式に出力してから「Ctrl+A」で全範囲選択、テキストをふたたびMicrosoft Wordファイルにコピー&ペーストしてボリュームをカウントしましょう。

原稿に画像などが挿入されている場合

原稿に画像などが挿入されている場合、当然ながらそこにテキストが含まれていても、Microsoft Wordの「文字カウント機能」ではカウントすることができません。

画像内に含まれるテキストのボリュームもカウントする必要がある場合は、その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

原稿がMicrosoft Excelファイル形式のテキストの場合

原稿がMicrosoft Excelファイル形式のテキストの場合は、カウントする必要のあるテキストすべてを範囲選択、またはシートごと範囲選択した上で一旦PDFファイル形式に出力してから「Ctrl+A」で全範囲選択、テキストをふたたびMicrosoft Wordファイルにコピー&ペーストしてボリュームをカウントしましょう。

ただし、画像などが挿入されていてそこにテキストが含まれていても、Microsoft Wordの「文字カウント機能」ではカウントすることができませんので、その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

Microsoft ExcelファイルをPDFファイル形式に出力する際、出力が必要なシートすべてを選択することを忘れないようにしましょう。複数シートに渡ってテキストが含まれている場合などは特に注意が必要です。

原稿がMicrosoft PowerPointファイル形式のテキストの場合

原稿がMicrosoft PowerPointファイル形式のテキストの場合は、Microsoft Excelファイルへの対処と同様に、カウントする必要のあるテキストすべてを範囲選択、またはシートごと範囲選択した上で一旦PDFファイル形式に出力してから「Ctrl+A」で全範囲選択、テキストをふたたびMicrosoft Wordファイルにコピー&ペーストしてボリュームをカウントしましょう。

テキストが含まれた画像などが挿入されている場合の対処も同様です。その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

Microsoft PowerPointファイルをPDFファイル形式に出力する際は、スライド部だけでなくメモ欄(通常はスライドの下に表示)にテキストが含まれていないかも注意しましょう。

原稿がAdobe Illustratorファイル形式のテキストの場合

原稿がAdobe Illustratorファイル形式のテキストの場合は、Microsoft Excel、PowerPointファイルへの対処と同様に、カウントする必要のあるテキストすべてを範囲選択、またはシートごと範囲選択した上で一旦PDFファイル形式に出力してから「Ctrl+A」で全範囲選択、テキストをふたたびMicrosoft Wordファイルにコピー&ペーストしてボリュームをカウントしましょう。

テキストが含まれた画像などが挿入されている場合の対処も同様です。その部分のみ手計算でカウントするかもしくは、OCRソフトを使ってカウントしましょう。

原稿がAdobe Photoshopファイル形式のテキストの場合

原稿がAdobe Photoshopファイル形式のテキストの場合は、上述の原稿がAdobe Illustratorファイル形式のテキストの場合と同じ方法でボリュームをカウントしましょう。

原稿がAdobe InDesignファイル形式のテキストの場合

原稿がAdobe InDesignファイル形式のテキストの場合は、上述の原稿がAdobe Illustratorファイル形式のテキストの場合と同じ方法でボリュームをカウントしましょう。

原稿がウェブサイト(HTMLほか)のテキストの場合

原稿がウェブサイト(HTMLほか)のテキストの場合は、ボリュームをカウントする前にまず、カウントする必要のあるページや箇所を特定する(定義付ける)作業が必要です。

なぜなら、LP(ランディングページ)などごく一部を除き、ウェブサイトは通常何ページに渡って構成されていること、また、各ページにはリンクが複数設定されていること、そのほかにもメニューやバナーなど、同じ内容のテキストが繰り返し使用されていることが多いため、ボリュームカウントの仕方によっては結果が大きく異なってくるからです。

ウェブサイトでボリュームをカウントする必要のあるページを定義付けるには次のような方法があります。

  • ボリュームをカウントする必要のあるページのURLリストを作る
  • ボリュームをカウントする必要のあるページひとつひとつをPDFファイル形式に出力する

URLをリストを作成する場合はあらかじめ、「クリックした際に表示されるページに含まれるすべてのテキストを対象とする」といった定義を設定しておくことも寛容です。

カウントする必要のあるページや箇所を特定(定義)さえすれば、あとはそのページをPDFファイル形式に出力してからMicrosoft Wordファイルにテキストをコピー&ペーストしてボリュームをカウントする、といった方法は前述のその他のファイル形式のテキストと同様です。

まとめ

以上が「翻訳ボリュームのカウント方法について」ですが、翻訳料金を決定付ける三大要素のひとつである「ボリューム」は、そのカウント結果によって翻訳料金が大きく変動するもっとも大切な要素です。

ボリュームのカウントの仕方を間違えることによって重大な問題につながる可能性があるため、細心の注意を以て行なうようにしましょう。

また、より詳細確認がご必要な場合はお気軽にお問い合わせください!

翻訳商社ノーヴァネクサスの翻訳・通訳・外国語人材サービス

英語、中国語、韓国語をはじめ、ドイツ語、フランス語、イタリア語、スペイン語、ポルトガル語、ロシア語、アラビア語など世界120か国語の翻訳、校閲/校正、通訳、外国語人材サービスをご提供しています。

民間企業様のグローバルビジネス、行政機関様や各種法人様の海外調査や外国人対応から個人様の外国語申請など、お客様の外国語、外国語人材に関するお困り事を解決します。

ご相談は無料です。お気軽にお問い合わせください。

翻訳商社

最新情報をお届けします