翻訳の見積書でここがわからない!「準備作業」って何をしているの?

翻訳プロジェクトのお見積り時に、「準備作業」という項目を計上させていただく場合があります。「準備」と言われても、何をしているのかよくわかりませんよね。そこで今回の記事では、この作業の具体的な内容について、例を挙げてご説明します。

翻訳プロジェクトの「準備作業」とは

準備作業は、大きく「ファイルの前処理」と「解析」の2つに分けられます。作業としては、「ファイルの前処理」→「解析」の順に進めることが多いのですが、本記事ではイメージしやすい「解析」からご説明します。

「解析」とは

翻訳対象を解析することで、①翻訳するワード数、②繰り返しのワード数、既存のTMがある場合は③TMとのマッチ率を確認できます(繰り返しについては「繰り返しが多い複数の文書やファイルの上手な扱い方」、マッチ率については「翻訳メモリのマッチ率とは」の記事で詳しく説明しています)。解析は、翻訳支援ツールを使って行います。この解析結果を元にお見積りを進めます。

111.pngもう1つの準備作業である「ファイルの前処理」は、解析作業を無駄なく進めるために行います。

「ファイルの前処理」とは

ファイルの前処理では、①画像になった文字の抽出②翻訳が不要な部分の判断・除外③不要な改行の削除を主に行います。実作業に則した解析を行うために、翻訳対象を正確に特定したり、既存のTMを最大限活用できるようにしたりすることが目的です。

①画像になった文字の抽出

バイナリ形式の画像ファイル(jpegファイルなど)に文字が含まれていて、その部分の翻訳が必要な場合、翻訳支援ツールに読み込ませるために、文字をテキストファイルなどに書き出します(これは翻訳のための一時処置であり、訳文が完成したら、それを使ってDTP工程で日本語版の画像を作成します)。

②翻訳が不要な部分の判断・除外

翻訳対象によっては、json、html、xmlなどのファイルをソースとしてご提供いただくことがあります。このような形式のファイルには、本文以外にタグや属性情報など、さまざまな情報が含まれます。ファイル形式や構文を確認し、翻訳支援ツールの抽出設定を調整したり、場合によってはWordの隠し文字設定などを活用したりして、翻訳が不要な部分を確実に排除するようにします。

また、ドキュメントの冒頭や末尾に、著作権に関する記述などの法的な文がある場合があります。この部分の翻訳作業は非常にデリケートなため、状況に応じてあえて翻訳対象から除外するお客様もいらっしゃいます。

③不要な改行の処理

お客様から支給された翻訳対象ファイルには、文の途中に改行が入っていることがあります。これをそのまま翻訳支援ツールに読み込ませると、改行の部分でセグメントが切れてしまいます(例の1・2セグメント)。さらに、英日翻訳の場合、原文と訳文で語順が異なることが多いので、改行位置によっては、原文と訳文が対応しないセグメントができてしまう可能性があります(例の3・4セグメント)。

20161020_75_fig.pngまた、この画像の例で、既存のTMに「Bob was doing...running out of soap.」という文が登録されていたとしましょう。既存のTMと同じ文があるので本来なら100%マッチになるはずなのですが、セグメントが分割されていると、TMの文と一部しかマッチしないため、新規翻訳やファジーマッチとして処理されてしまいます。

このような事態を減らし、翻訳効率を最大限にしてTM内のデータの品質を高めるために、不要な改行を確認して削除します。

オプション:解析後の準備作業

解析後はそのまま翻訳作業に進める場合が多いですが、複数人で翻訳を分担する場合は、解析が終わったあとにファイルの分割処理を行います。

ゼロからの翻訳会社選びは不定期更新です。FacebookページTwitterをフォローして最新情報をご確認ください。