FX30の同期精度
2カメ収録用にFX30を買い足したのですが、複数台のカメラで同時に撮影したときに気になるのは、各機材の同期精度です。FX30に外部同期の機能は無いので、複数台のFX30で撮影する場合の同期精度は各カメラに内蔵されたクロックの精度頼みです。このクロックの精度について、FX30のマニュアルなどには明記されていません。(私は、一時期FX30はTCXO搭載の精度があると思っていたのですが、何か他の機材の仕様と間違って認識していたようです。)
今回は、2台から3台のFX30で長時間録画した場合に、収録素材にどの程度のズレが生じるかを試します。
INDEX
どこから同期ズレ?
映像のみで考えたとき、或いは音声と映像とのすり合わせという点で考えたとき、ズレの許容範囲は1フレーム以内と考えて良いと思います。理由は、それ以上補正しようがないためです。
2つの映像素材のズレが0.5フレーム以上になった時、そのズレを補正するために片方の素材を繰り上げるべきか繰り下げるべきかといった判断が必要になり、許容範囲は0.5フレームかとも思えます。しかし、繰り上げ、繰り下げという視点で考えた場合、ズレを判断する起点は0ではなく-0.5を起点として考えるべきです。つまり、この場合も-0.5から+0.5までの1フレームが許容範囲ということになります。
一方、音声と映像のすり合わせという点で考えた時、映像よりも音声が先行すると違和感があります。これは、現実世界で光の速度よりも遅い音が遅れて聞こえることはあっても、その逆はないといった経験的なことに由来すると思われます。つまり、映像に対して音声をすり合わせる場合に、音を繰り上げるといったことはなく、ピッタリと揃った状態から1フレーム未満の遅れまでが許容範囲といえます。(特別な演出的な意図があって音を先行させるといったケースは、当然除きます。)
ミックスするための音声素材としては、どの程度のズレが許容範囲でしょうか。24fpsでの収録の場合、2つ以上の音声素材に1フレーム程のズレが生じるとリバーブ(エコー)がかかったように聞こえ、それ以上のズレが生じた場合にはディレイがかかったように聞こえます。では、1フレーム以下のズレの場合はどうでしょうか。
ミックスするための音声素材に1フレーム以下の僅かなズレが生じた場合、音声波形の位相ズレによる影響が現れる可能性があります。もっとも、収録時の条件などによって位相のズレによる影響の程度は異なり、多くの場合それほど深刻なものではありません。それでも、音声の場合は映像よりも同期のズレに注意を払ったほうが良さそうです。同期と位相の変化については、「音の位相と同期」をご覧ください。
3台のFX30の同期
3台のFX30で収録をする機会があり、最も長いクリップでは1時間ほどの長時間録画を行いました。収録映像のフレームレートは24fpsです。また、予備音声としてZOOMのM3 MicTrakというガンマイク型のレコーダーでも収録をしました。これら4つの機材は1箇所にまとめて設置したので、音源からの距離は全てほぼ同じ、つまり音の到達時間の差は無いと考えて差し支えありません。
それぞれの機材で収録したクリップをAppleの動画編集アプリFinal Cut Pro(ファイナルカットプロ 以下FCP)のタイムラインに並べて、どの程度の誤差が発生しているかを比較してみました。
c13_fig_01は、収録開始部分で同期状態を判断しやすそうな特徴的な波形を見つけて、各クリップのタイミングを合わせた画像です。FX30_Ccamの黄色く囲われた範囲が1フレームの長さです。クリップのサムネイルと波形の表示設定を変更して、全てのクリップを音声波形のみの表示にしています。FCPのサムネイルと波形の表示比率についてはこちらをご覧ください。

収録開始時の3台のFX30とZOOM M3 MicTrakの音声波形
外部同期をかけていないので、映像の1フレーム内での音声波形の位置に僅かなズレがあります。同期信号を入力して各カメラを同期した場合、長時間の録画でズレが発生しないことはもちろんですが、各フレーム内での音声の位置もズレることはありません。しかし、カメラ内蔵のクロック精度頼みで収録した場合、それぞれのカメラの録画ボタンを押すタイミングによってフレーム内の音声の位置に微妙なズレが生じます。FCPの場合、音声を展開してトリム操作をすることでズレを微調整することもできるのですが、ここでは修正していません。オーディオを展開してのトリム操作については、「FCP、基本ストーリーラインに何を置く? 2」の「オーディオクリップと基本ストーリーライン」をご覧ください。
ZOOM M3 MicTrakで収録した音声クリップはフレーム単位にとらわれずに位置を調整できるので、FX30_Acamのスタート位置とピッタリと揃えました。
各クリップの音声波形のズレの量を範囲選択をして測ってみると、FX30_Acamに対してFX30_Bcamは0.02フレーム遅れ、FX30_Ccamは0.17フレーム先行しています。この0.02や0.17という値は、サブフレームという1/80フレームで表した数字です。
次に、この収録素材の末尾近くで特徴的な波形部分を拡大したのがc13_fig_02で、約1時間後の波形です。こちらも黄色い枠が1フレームの長さを表します。それぞれの音声波形を見ると、収録開始時よりもズレが広がっているのがわかります。

1時間収録した3台のFX30とZOOM M3 MicTrakの音声波形
c13_fig_01と同様の方法で波形のズレを測り、誤差を計算したのが以下の表です。1/80フレームではこの後の計算が面倒なので、1/100フレームに換算して記載しています。
機材 | 開始時 | 終了時 | 誤差 |
---|---|---|---|
FX30_Acam | 0 | 0 | (0) |
FX30_Bcam | +0.01 | +0.09 | +0.08 |
FX30_Ccam | -0.18 | -0.11 | +0.07 |
ZOOM M3 MicTrak | 0 | +0.23 | +0.23 |
FX30_Acamの音声波形を基準として他を揃えたので、Acamは相対的に誤差0フレームという記載になっています。FX30_Acamが特に正確という意味ではありません。
基準としたAcamと比較すると、Bcamで0.08フレーム、Ccamで0.07フレームとおよそ1フレーム弱のズレがあります。これは1時間での誤差なので、24時間だと1.68から1.92フレームの誤差になる計算です。
機材の内蔵クロックとして精度が高いとされるTCXOという発振器の場合、その誤差は24時間で0.5フレーム以内とされているようです。0.5フレーム誤差がプラスマイナスだとすると、2台のTCXO搭載機の誤差の振れ幅は最大+0.5フレームから-0.5フレームとなる可能性があり、その差は1フレームと考えることができます。今回試したFX30では、TCXO搭載機に比べて1.5倍から2倍ほど誤差が大きいといったところでしょうか。
ZOOMのM3 MicTrakは約0.2フレームともう少し同期精度は落ちるようです。ただし、1時間の収録で1フレーム以下の誤差なので、ミックス用の音声素材としてではなく、ZOOM M3 MicTrakで収録した音声のみを使用するのであれば大きな問題はなさそうです。
誤差は広がるか
普通に考えれば、誤差は次第に広がっていくと考えます。しかし、ある時は誤差が増加し、ある時は減少するといったフラつきを伴った誤差の可能性もあります。そこで、2台のFX30で撮影をし、30分おきにカチンコを鳴らすテストをしてみました。今回は2台のFX30のみで100分間撮影した結果です。ここでも、収録映像のフレームレートは24fpsです。
2台のFX30で撮影したクリップをFCPに読み込み、マルチカムクリップ化した上で各カチンコの音声部分を拡大したのが以下の画像です。3カメ収録の場合の画像と同様に、黄色く囲われた部分が1フレーム分の範囲です。
なお、各画像ごとのカチンコを叩く音声波形の位置がフレームの枠内で前後していますが、これは30分おきにカチンコを叩いた時それぞれの場合で、カメラがフレームを記録するタイミングとカチンコを叩くタイミングのズレです。手作業でカチンコを叩いている以上仕方のないズレで、同期精度とは関係ありません。各画像ごとのAcamとBcamの音声波形のズレに注目してください。

2台のFX30で100分収録し、30分おきにカチンコを鳴らした0分目

同30分目

同60分目

同90分目

同100分目
画像を見ると、僅かづつ誤差が広がっているように見えます。誤差の長さを範囲選択して測り、1/100フレームに換算したのが以下の表です。なお、「30分毎の誤差」と「積算誤差」の関係には、小数点3位以下を四捨五入したことによる誤差があります。
収録時間 | 各時毎の誤差 | 30分毎の誤差 | 積算誤差 (各時誤差から算出) |
---|---|---|---|
0分 | +0.08 | 0 | (0) |
30分 | +0.1 | +0.02 | +0.02 |
60分 | +0.13 | +0.02 | +0.05 |
90分 | +0.15 | +0.02 | +0.07 |
100分 | +0.16 | +0.01 | +0.08 |
カメラのA・Bは、前項の3カメ収録の場合と同じ組み合わせです。上記の表を見る限り、誤差は増減せずに次第に増加しています。また、Acamに対してBcamが遅れ、その誤差は60分で+0.05という結果は3カメ収録の場合の+0.08と近い値です。
以上のことから、ここで試した2台のFX30の誤差は増減するような形では現れず、内蔵クロックの歩進が速いか遅いかという形で現れ、誤差の生じる割合もある程度安定していることが分かります。
タイムコードの同期精度
タイムコードの同期精度は映像の同期精度と同じと考えて差し支えありません。ただし、ここで試した同期精度は連続記録の場合です。一旦電源を切った場合やバッテリー交換で電池を引き抜いた場合、FX30内部のクロックの精度が低下することが考えられます。
実際に、以前2台のFX3か30のいずれかで収録した素材の整理をさせて頂く機会がありました。FX3か30かは、たまたま画面に映り込んだカメラでそのいずれかだと分かっただけで、外見がほとんど同じカメラなので区別がつきませんでした。或いはレンズに詳しければ峻別できたのかもしれませんが、あいにくそこまで詳しくないので、3か30かのいずれかとしか分かりませんでした。
2週間ほどのロケで撮影された素材で、ロケの初日に2台のタイムコードを揃えたと思われ、最初のうちはタイムコードで2台のカメラの素材を探すことができました。しかし、その後のロケ中にはタイムコードの設定を見なおすことは無かったようで、ロケの日が経つにつれてタイムコードのズレは大きくなっていきました。後半の素材ではタイムコードの値で1カメに対応する2カメのカットを探すことは出来ないほどのズレ具合でした。
上記でみてきたように、記録時のFX30のクロック精度は6時間で0.5フレーム程度の誤差に収まることが期待でき、1日で2フレーム、10日で20フレームと1秒以内のズレに収まるはずです。しかし、10日間から14日間ほどの期間でズレは数分程度に広がっていったと記憶しています。
恐らくこれは、カメラの仕様として電源を切ったタイミングでクロックの精度を落とし、不要なバッテリーの消耗を防ぐよう設計されているためと思われます。バッテリー交換のタイミングも同様です。カメラには、バッテリーを外しても内部のカレンダーのデータを保持する程度の予備バッテリーが内蔵されているのだと思いますが、撮影時ほどの精度を維持する電力ではないのだと思います。
タイムコードの同期を維持するには、カメラの電源操作を行うごとに、マスタークロックからの再同期を行うのが理想的だと思われます。ただし、細かな電源の入り切りの都度、大きなズレが発生するとは思えません。撮影場所の移動などで長時間カメラの電源を切った場合に、タイムコードの再設定を行う程度で問題ないと思います。
まとめ
今回試したFX30では、TCXO搭載の機器よりも僅かに劣る程度の同期精度が期待できるようです。TCXOの場合は24時間で0.5フレーム誤差とされるのに対し、2倍程度の誤差とみてよさそうです。今回テストした2台のFX30では、6時間から10時間で0.5フレーム程度の誤差での収録が期待できそうです。
これはタイムコードの同期精度でも同様と考えて差し支えありませんが、カメラの電源を切った場合は、クロックの精度が大きく低下すると思われます。タイムコード同期での収録の場合は、数時間おきにマスタークロックからの再同期を行うのが無難です。
今回は初春の比較的温度の安定した室内でテストを行いました。夏季の屋外など高音になる環境で、同等の結果が出るかはわかりません。