翻訳の見積書でここがわからない！「準備作業」って何をしているの？

翻訳プロジェクトの見積りには「準備作業」という項目を計上させていただく場合があります。「準備」と言われても、何をしているのかよくわかりませんよね。そこで今回の記事では、例を使って具体的な内容をご説明します。

翻訳プロジェクトの「準備作業」とは

準備作業は、大きく「ファイルの前処理」と「解析」の2つに分けられます。作業としては、「ファイルの前処理」→「解析」の順に進めることが多いのですが、本記事ではイメージしやすい「解析」からご説明します。

「解析」とは

翻訳対象を解析することで、①翻訳するワード数、②繰り返しのワード数、既存の翻訳メモリ（Translation Memory, TM）がある場合は③TMとのマッチ率を確認できます（繰り返しについては「繰り返しが多い複数の文書やファイルの上手な扱い方」、マッチ率については「翻訳メモリのマッチ率とは」の記事で詳しく説明しています）。解析は、翻訳支援ツールを使って行います。この解析結果を元に見積りの作成を進めます。

以下に、解析結果の例を示します。

「ファイルの前処理」とは

もう1つの準備作業である「ファイルの前処理」は、解析作業を無駄なく進めるために行います。ファイルの前処理では、①画像になった文字の抽出、②翻訳が不要な部分の判断・除外、③不要な改行の削除を主に行います。実作業に則した解析を行うために、翻訳対象を正確に特定したり、既存のTMを最大限活用できるようにしたりすることが目的です。

①画像になった文字の抽出

バイナリ形式の画像ファイル（jpegファイルなど）に文字が含まれていて、その部分の翻訳が必要な場合、翻訳支援ツールに読み込ませるために、文字をテキストファイルなどに書き出します（これは翻訳のための一時処置であり、訳文が完成したら、DTP工程で日本語を組み込んだ画像を作成します）。

②翻訳が不要な部分の判断・除外

翻訳対象によっては、json、html、xmlなどのファイルをソースとしてご提供いただくことがあります。このような形式のファイルには、本文以外にタグや属性情報など、さまざまな情報が含まれます。ファイル形式や構文を確認し、翻訳支援ツールの抽出設定を調整したり、場合によってはWordの隠し文字設定などを活用したりして、翻訳が不要な部分を確実に排除するようにします。

また、ドキュメントの冒頭や末尾に、著作権に関する記述などの法的な文がある場合があります。この部分の翻訳作業は非常にデリケートなため、状況に応じてあえて翻訳対象から除外するお客様もいらっしゃいます。

③不要な改行の処理

お客様から支給された翻訳対象ファイルには、文の途中に改行が入っていることがあります。これをそのまま翻訳支援ツールに読み込ませると、改行の部分でセグメントが切れてしまいます（次の画像の1つ目と2つ目のセグメント）。英日翻訳の場合、原文と訳文で語順が異なることが多いので、改行位置によっては、原文と訳文が対応しないセグメントができてしまう可能性があります（3つ目と4つ目のセグメント）。

また、この画像の例で、既存のTMに「Bob was doing the dishes, and noticed that he was running out of soap.」という文が登録されていたとしましょう。既存のTMと同じ文があるので本来なら100%マッチになるはずなのですが、画像のようにセグメントが分割されていると、TMの文と一部しかマッチしないため、新規翻訳やファジーマッチとして処理されてしまいます。

このような事態を減らし、翻訳効率を最大限にしてTM内のデータの品質を高めるために、不要な改行を確認して削除します。

オプション：解析後の準備作業

解析後はそのまま翻訳作業に進むことが多いのですが、複数人で翻訳を分担する場合は、解析が終わったあとにファイルの分割処理を行います。

まとめ

今回は「準備作業」についてご説明しましたが、だいたいのイメージはつかめたでしょうか。見積り作成に無駄が出ないように、また、翻訳作業をすんなり進められるように、事前にちょっと手間をかけて行う「下ごしらえ」のようなものです。このような見積りの中の項目に限らず、取引を始める前に気になることがあったら、気軽に質問してください。