1本ごとに制作費がかかるので多くの本数を製作できません。また製作時間もかかります。
さらにできあがったレーザーディスクなどを、業者が全国の各店を回って配布する必要があります。
ですから、その曲のレコード・CDの発売日から、カラオケで歌えるようになるまでに早くて数ヶ月単位の時間が掛かります。人件費などの費用もかかります。
そんな中、1992年に通信カラオケが登場。従来のカラオケの概念を大きく変えました。
最初の通信カラオケは「X2000」と「JOYSOUND」であるとされています。
カラオケ業者に置かれたサーバから、曲のデータが全国の通信カラオケ機器設置店宛に配信されます。配信されるデータは、MIDIによる演奏データと歌詞です。
通信カラオケ機器は、配信されたMIDIデータと歌詞を保存して演奏する音声ライブラリと、映像を出すことのできる映像ライブラリ(最初はレーザーディスクなど、後にビデオCDやDVDなど)とを備えます。
そして、客からのリクエストがあった曲のMIDIデータを音声ライブラリから再生し、マイクの音と合わせてアンプで増幅してスピーカーから出します。
また、映像ライブラリからテキトーに選んだ映像に歌詞を重ねてモニターに表示します。
通信カラオケの音は、基本的にはシンセサイザーによってのみ作られます。その製作は、音を聴き取ってデータを打ち込むことのできる人がいればできます。何人もの演奏家を集めてスタジオを確保して…なんて必要はなくなります。映像も曲ごとに作る必要がなくなります。レーザーディスクを店ごとに届ける必要もなくなります。
ですから、制作費とランニングコストは格段に安くなりました。歌える曲数は大幅に増えました。レーザー時代は数千曲単位だった曲数が、すぐに数万曲単位に増えました。CDの発売日からすぐに歌えるようにもなりました。
かくして、通信カラオケは一気に広まり、特にカラオケボックスにおいては急激にレーザーカラオケが駆逐され、通信カラオケに置き換わりました。
しかし、レーザーから通信カラオケに移行することにより、失われたものもありました。
当初、データの配信にはアナログ回線か、良くてISDN。ですから、MIDIデータ(それも音数が少ない)を
配信することしかできませんでした。
そのため、通信カラオケの音は、レーザーと比べて明らかに貧弱。ギター、ピアノ、ブラス、ストリングスなどの音は、シンセサイザーで再現しようとすること自体に無理があるとさえ言えます。
またコーラスとか合いの手とかの人間の肉声は、シンセサイザーでは再現できません。せいぜい「ふぁ〜…」っていうような気の抜けた感じの音が、コーラスパートの代わりに入るだけです。
コーラスなど一部の音に肉声や生演奏を使い、それと従来のMIDIデータを組み合わせるという試みもありました。ですが、そうするとデータ容量が大きくなって、アナログ電話やISDNの回線では配信が難しくなります。
さらに、映像も内蔵される映像ライブラリから「テキトーに」選ばれるので、歌詞の内容には全然関係のないトンチンカンな映像になることが多くあります。同じボックスで歌い続けていると、「さっきも見た映像」が何度も出てくることにもなります。
これらは、通信カラオケの基本的な構造上、「どうしようもないこと」であると言わざるを得ません。今もなお、通信カラオケはこの弱点を抱え続けています。
しかし、21世紀に入り、ブロードバンド回線が普及し、大容量のデータを配信できるようになったことにより、状況が変わってきました。

