・遠隔収録編
★まずは状況からだ。
という訳で今回のネタ提供兼アドバイザーを勤めて頂きます、GOLDENBELLのきやましんたろーさんでーす。どもー。
「どもー。よろしくー。ってこんな感じでいいの?」
いいですいいです。私が進行していきますので要所要所でコメントして頂ければ・・・・・って前回もやったなこのマエフリ。
という訳でまずは、なぜに遠隔収録が必要か、から説明していこうと思う訳ですが。
基本的にGOLDENBELLのメインを勤めているお二方は、普段別々の場所にお住まいになっています。きやま氏は静岡県静岡市在住。一方五代氏は東京都練馬区在住です。番組の更新は月4回(2000年6月より再び月2回更新)。まさかこの度にどちらかが東京静岡間を往復するのには体的にも金銭的にも無理があり過ぎる、と。遠隔収録の定番としては電話がありますが、これもまた頻繁にやってると目玉飛び出るほどの電話料金を負担しなきゃいけなくなる。
という訳で、安くて使い物になる収録手段というのが、どうしても必要になってしまった、と。それがインターネットフォンに手を染めた理由になります。
「手を染めるってなんか犯罪者みたいっすね」
ん?気のせい気のせい。
ただ、どっちにしろこうやってGOLDENBELLさんが遠隔収録にチャレンジした意義ってものすごく高いんですよ。というのも、何も物理的距離制約の解消だけじゃないんです。インターネットフォンの利用って。
たとえば、ちょっと思い付くだけでこう。
★収録場所が必要なくなる
複数人数で収録を行おうとすると、どうしても「集まる場所」が必要になります。でも、多人数集まれて、気兼ねなく大声出せる環境なんてそうそう無いのが現実でもありますわな。ワゴン車の中で収録してる五村富士という実例もありますし。
その点インターネットフォン使ってそれぞれ自室で収録できれば、物理的なスペースは必要なくなります。
★時間的制約負担の減少
これも上と同じ。複数人収録の場合は特に、その収録時間中は全員が一個所に拘束されてしまいます。でも、それぞれ自室に環境があれば、「お互い家にいて起きてる」時間帯ならばいつでも収録ができる。この精神的負担の軽減というのは劇的な効果をもたらします。
「実際、以前にくらべて収録までの段取りは格段にラクになりましたね。以前だったら事前に何回も連絡取り合って日時決めて・・・となってましたけど、今はメールで『今日夜ヒマ〜?』『じゃあ今日録ろうよ』でいいですからね。」
ほらね。ラクにできるもんはラクにできた方がいいんです。
んじゃ、まずはいきなりそのインターネットフォン実物を見せて頂きましょう。
★インターネットフォンのしくみ
という訳でまずは簡単に図示してみましょか。
・・・・・・・すまんねぇ、相変わらずの絵心の無さ。
「ほんとヘタですね」
ほっとけ。静岡側のMacと東京側のWin95をそれぞれインターネットに接続し、あたかも電話を使用しているかのように、お互い同士でくっちゃべる。だからインターネットフォン。うん。まんまです。
ちなみにお互い通信環境はモデム54Kを使用しています。逆を言えばモデムで さえももう会話できるんだよなぁ・・・。そうなんですよね、非現実的なクソ高いパソコンを使う必要性ってのは無いんですよ。今はISDNでもそれほど費用が高い訳でもないですし。なんならそこらの組み立てパソコンとそこらのTA直結して使っちゃえばいい訳で。いやぁ、9600bpsで「おーはやいー」と言ってた時代考えれば格段の差だよなぁ・・・・。
「あのー、感傷に浸るのもいいですが説明を・・・」
あ、はいはいはいすんません。
で、インターネットフォン環境を実現するためには上の環境の他に、インターネットフォン用のソフトが必要になります。このソフトの吟味・比較検討は予めGOLDENBELLさんの方でやってくれました。んじゃ、ここだけ説明お願いできます?
「はいはい。えっと結果から言いますと、GOLDENBELLでは『Monkey Com』というインターネットフォンソフトを使用しています。ソフト自体は単品を買うのではなく、このソフトがバンドルしているCCDカメラを東京静岡それぞれで1台づつ購入して手に入れました。ちなみにCCDは単純に『顔も見られたら喋りやすいよね』という理由のみで買ってます。」
ふむふむ。んじゃこれを選んだ理由は?
「消去法ですね。欲しい条件を選んでいったら最後にこれが残ったという状態です。」
つー訳でGOLDENBELLさんが選定した際の評価基準はこの2つ。
★Win95、Mac両方で利用可能
ま、当然ですわな。いわずもがな。でも、意外と多いんすよ。Winのみ対応しているソフトとか、Macのみのソフトとか。
★ピアツーピア接続が可能
あ、これちょっと説明必要かも。一口にインターネットフォンと言ってもその通信実現方式は大きく2つに分類されます。
ひとつはサーバ経由型(C-S-C)。インターネットフォンを処理する専用のサーバを介してデータをやりとりする方式。
一方のピアツーピア(C-C)は、一対一、つまりクライアント同士直に接続してデータをやりとりするんです。
で、なんでGOLDENBELLがピアツーピアを選んだかというと、テレホ時間帯でも影響を受けにくい(ゼロではないけど)のと、3者以上での会話をする必要がほとんどないから、という判断だそうです。
逆にサーバ経由型の場合は、サーバ能力に大きく依存されますが、3者間(もしくはそれ以上)の会話時にはピアツーピアより効率よくデータ送受信が可能なんですな。この辺の条件を見極めつつ、使えそうなソフトを物色する必要がある訳です。
「これらの条件をクリアできてかつ、値段的に手頃だったのがこれだった、と。」
なるほどねー。
★現実はそんなに甘くない。
遠隔通信環境のお話はよくわかりました。んじゃあとは実際に試してみて、その実力を・・・。
「ちょっと待った。」
へ?まだ何かあるの?
「ちょっとこれを聞いてみてもらえます?」
ん?DAT?何すんのこれ?
「いいからいいから」
はいな・・・・・・・・ん?
『こんにちは、きやましんたろーです・・・・・・・・・・・・・』
なんでもこれ、過去の放送分らしいです。
『・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・こんにちは、五代明です・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・練馬の様子はどうですか?・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・練馬はねぇ、晴れてます・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・こっちも晴れてますよ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・そうですかぁ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・』
なんすか?この『・・・・・・』の羅列は?会話というよりはやまびこの呼び合いのような、とにかく間が開きすぎてますよ?それに・・・・・・なんつーか、私がこうゆう事言うのも何ですけど、とても放送できる音質じゃないですけど?会話はなんとか聞き取れますけど、普段流れてるGOLDENBELLの音質とはかけ離れてますよ?
「これがインターネットフォンの会話直に録音した音です。」
・・・・・・・・・・・・・・・・へ?
・・・・・・・・・・・・・・・・・。
・・・・・・・・・・・・・・・・・。
・・・・・・ええええええええええぇぇぇっっっ!!!!インターネットフォンの音質ってこんなもんなのぉぉぉぉおおおお!!!
「こんなもんです。」
えらい冷静ですね。そりゃ毎週触ってるから慣れてるんでしょうけど。
「音質頼るんだったらインターネットフォン使うより直接電話使った方がよっぽどマシです。でも電話だって上は知れてますしね。それに、何もインターネットフォンの音だけが音じゃないですしね。」
あ、今、目が光った。
「きらーん」
★インターネットフォンが(今)使えない理由
つー訳でこちらも冷静になって、改めて振り返ってみたいと思います。
結論から言えば、インターネットフォンの音声は全く使いモンになりません。
理由は大きく分けて次のふたつ。
(1)音質そのものが悪い。
インターネットフォンの音の目安は「相手が何を言っているのかが聞き取れる」程度のモンだと思ってください。どうひいきめに見積もってもAMラジオの数倍は音質悪いです。
「え?でもなんで?私モデムユーザだけどRealPlayerのストリーミングきれいに聞こえますよ?」という方もいらっしゃるでしょう。つー訳で簡単に解説。
基本的にRealPlayerやWindowsMediaPlayerから送られてくる音声データは予め送り側でエンコード(圧縮)された形でインターネット上を流れます。つまり本来なら100あるデータを75位に一度ムリヤリ縮め、パソコンで受け取ってから改めて100にデコード(解凍)してそれを聞いている訳です。
ところが、インターネットフォンの音声データの場合、このエンコードという作業が入りません。リアルタイムに相手にデータを送らないといけないからです。したがって100あるデータは100のまま送信されます。
当然この状態ですと、相手側が受け取るのに苦労してしまいます。テレホタイムのストリーミング受信を思い出してください。音がプチプチ切れたりするでしょ?あれと同じ状態になってしまう。
そこで、インターネットフォンの場合は、予め送る側で、相手に送る情報を選別してしまいます(これがインターネットフォンソフトの大きな役割のひとつ)。必要無い情報を全部捨てて、残った部分のみを送信する訳ですな。
RealPlayerがフトン圧縮袋なら、インターネットフォンはフトンちょんぎって綿抜いて量減らすようなもんなんです。
その結果、相手に聞こえる音声というのは「聞くのがやっと」という音質になってしまう訳。
「まぁ音質に関しては今のISDN程度の送信速度ではこれが限界かな、という感じです。将来インフラが揃えば、情報を削ぎ落とすことなく送ることができるようになる訳ですから、この辺はまだまだ改善できるでしょうね。ただ。」
ただ?
「ラジオにインターネットフォンを使う場合、こっちの問題の方が大きいです。」
(2)ディレイ(遅延)
上の例で言う「・・・・・・・・・・・・・・・」の羅列。これがディレイ。要は喋ってる声がリアルタイムに相手のスピーカーに流れることはないんです。
これはある種インターネット(というかTCP/IP)の限界と言ってもいいんですけど。
上図をご覧ください。実際に東京から発せられた静岡のパソコンのスピーカーを鳴らすまでの間、音声データは途中のサーバ(黒丸)を経由していきます。いわゆるデータのバケツリレーなんですな。インターネットのデータ授受って。
当然ながら途中遅いサーバがあれば当然その分時間を食ってしまいますね。
それにたとえこの中途サーバがすべてドッ速であったとしても。上の限界は存在してしまいます。
「今のところは54K環境での実用なんですけど、これがたとえばISDNとか、 もしくはもっと上の高速接続になったとしても、まだディレイは起こると思いますね。」
うーん、という事はたとえこの1、2年で回線速度変わったとしても・・・
「おそらく、1秒以下になるのはきついかもしれませんね。今の高速インフラの更に上を行く技術が出てきてからの話になる、と。」
・・・・・・・1秒かぁ・・・・・・。きっついなぁ・・・・・・。
いやね、普通に喋り手同士が喋る分には1秒ってのはそれほど苦にならないもんなんですよ。
でもね、ラジオ番組における1秒の空間ってのは致命的なんですよ。この辺人間の耳ってワガママにできてましてね。一人が喋り終わってから、もう一人の人が喋り出すまでの「空白の時間」、これを違和感感じずに聞き続けられる限界って、せいぜいコンマ何秒の世界なんですよ。1秒となると、長時間になればなるほどじれったくなってくるんですね。
その事を考えると、我々が夢に描いていた「インターネットフォンの会話をそのまま録音→そのままインターネットに公開」の最速ショートカットは断念せざるを得ないんですな。必ずどこかで作り手側が手を入れざるを得ない。
うーん。なんか現実みちゃったような気分だなー。夢を見たくて静岡までやってきたのになー。
「まぁこればっかりはしょうがないですね。我々がどうこうできるレベルのお話になりますから。まだまだ技術の面では上がり続けるでしょうから、それをきたいして待つことにしましょうか。」
そですねー。この辺は頭カシコな人に託しましょう。ちと悔しいけど。
とはいえだ。今現実にGOLDENBELLはインターネットフォンによる遠隔録音やってる訳ですよね?この音質で。
「やってますね。」
じゃあなんで放送の音声はあんなにキレイに・・・。まさかボロボロになった音声をキレイにする装置でも使ってるとか・・・。
「わかってないで言ってますね。」
うん。
「そんな大層なことしなくても、ちょっと手間をかければ十分にインターネットフォンは使い物になりますよ。」
おせーておせーておせーて。
「節操なくなってきましたね。」
うん。
★じゃあ一体どうすんねんと。
という訳でして、では現実のインターネットフォンを現実に使うためのやり方を見ていきましょう。
まず結論から言ってしまおう。先ほどの図にちょっと書き加えますね。
従来のパソコンに向かってる黒いマイクに加えて赤いマイクが加わりましたな。で、その先にはMD、DAT。そして各パソコンへの矢印・・・。
「まぁ実際には1人がマイク2本使って喋ってる訳じゃないんですけどね。イメージ上はこっちの方がわかりやすいということで。」
あ、そゆことー。
「会話をする、という箇所だけをインターネットフォンに依存しまして、音声そのものは既存機材にてそれぞれ別個に収録。それを後でミキシングしてマスターを作成していますー。」
そっかー。疑似リアルタイム録音なんですねー。
★具体的なつくりかた。
んじゃ改めて初手から録音のプロセスを追ってみることにいたしませうか。
まず、お互いインターネットに接続し、インターネットフォンを立ち上げた段階で、双方が(ほぼ)同時に、手持ちの録音機材の録音スタートボタンを押します。厳密に録音スタートを合わせる必要はありません。「録音ボタン押してー」「押したよー」「んじゃ始めるよー」この程度でOK。
「要は編集時点で合わせてしまうってことなんですけどね。この辺は後程改めて説明します。」
ほーい。んじゃ双方の準備が整ったら収録スタート。あれやこれやくっちゃべりましょう。
「音声自体はそのまま録音されているので、特にインターネットフォンだから何をしなきゃいけないというのはないです。何言ってるのか聞き取れれば十分。ただ、どちらかと言ったらインターネットフォンで喋るというよりはちょっと昔のトランシーバーのような感じで喋った方がスムーズですね。」
なるほどねぇ。あ、ちなみに個別の録音機材の方ですが、基本的にはマイクをMD、もしくはDATに直付けしています。音声が取れればいいので、(音声の音量調節さえできれば)ミキサーも必要ありません。
さて、あれやこれやとくっちゃべりました。「終わりー」「おつかれー」となりました。
で、実はこっからがちょいと複雑な経路を辿るんですな。順番に説明していきましょう。
- 録音が終わったら東京側はMDの内容をそのまま.raファイル(レートはRealAudio ISDN)にエンコードしてGOLDENBELLのFTPサーバ経由で静岡側に配信。
- 以下静岡側作業。メールを受け取ったら東京側.raファイルを一旦DATに再録音する。
- 改めてDATから音源をパソコンに取り込む。取り込み方式はAIFF。
- 同様に静岡側DATもパソコンに取り込む。
- パソコン上にて2音声のミキシングを行い、放送用.raファイルを作成する。
うっわー。くそめんどくさそー。ミもフタもない感想だけどさ。
「まぁ音源が東京静岡に分かれている以上、これは宿命みたいなもんです。これでもパソコンに取り込む作業までは流れ作業ですから、負担にはならないですよ。」
あーさいですか。
あと、Win&Macでデータを共存する以上、複数の音声フォーマットが混在してしまうのは致し方ない所ですね。むしろこれでもキレイに収まってる方なのかも。
「中間にどのフォーマットを使うかとかは、それぞれの環境で好きなのを使えばいいと思いますよ。回線速度や状況によっても変わりますしね。」
とのことだそーです。ご参考にー。
という訳で、これにて、東京・静岡感を結んだ遠隔収録は無事収録し、無事Macの中に2つの音源ファイルが取り込まれました。
では、これをいよいよ放送用のマスターに作り上げてしまいましょう〜。