全4814文字
PR

 2021年1月の最終週あたりから国内でも爆発的に利用者を増やしている話題の音声SNS「Clubhouse(クラブハウス)」(米Alpha Exploration(アルファ・エクスプロレーション)。著者は音声系のネットアプリの開発に関わるエンジニアなので、話を聞いてすぐにIDを入手、興味津々で体験してみた。驚いたのは「雑談のしやすさ」だ。

Clubhouse音声テクノロジーをエンジニアが丸裸に
Clubhouse音声テクノロジーをエンジニアが丸裸に
(イラスト:ヤミクモ)
[画像のクリックで拡大表示]

 仕事柄、音声通信系のアプリは一通り使っている。今をときめく「Zoom(ズーム)」(米Zoom Video Communications(ズーム・ビデオ・コミュニケーションズ))はもちろん、「Skype(スカイプ)」「Discord(ディスコード)」「Google Meet(グーグル・ミート)」「FaceTime(フェイスタイム」「WebEx(ウェブエックス)」あたりは仕事で日常的に使っている。プライベートも含めると「LINE」や「Facebook Messenger」の音声通話も使う。

 だが会話に限るとClubhouseはそのどれよりもやりやすい。音質がよく感じるのもあり、雑談が弾むのだ。筆者だけではない。Clubhouseを使っている友人たちや、他の利用者も異口同音にそうした感想を述べる。その心地よさが人を呼び寄せ、有名人を含む多くの人たちが連日連夜、雑談を繰り広げる新しいプラットフォームが活況を呈している理由だろう。

 もちろん巧妙なサービスデザインやアプリの出来の良さ、操作画面(UI)の造りの巧みさなども雑談を促す特性に影響しているだろう。だがそれ以上に音声データのハンドリングなどにも秘密がありそうだ。これはちゃんと調べてみたいという好奇心がむくむく湧いてきた。

 ClubhouseはiPhone(iOS)専用だ。iPhoneアプリの通信は愛用のMacBookにUSBケーブルで接続して開発ツールを起動すれば簡単に内容を確認できる。Clubhouseを使っている友人たちに声をかけ、彼らの許諾を得て実験を行った。独自の調査で分かったClubhouseの通信の仕組みを解説していく。

「枯れた技術の水平思考」で開発、特別な技術は何もない

 最初に結論を述べておこう。驚くべきことに、Clubhouseは何も特別な技術を使っていなかった。ネットワーク構成は1台のサーバーに多数の端末がぶら下がる単純なクライアントサーバー型で、サーバーは音声のミキシングすらやっていない。音声ストリームは業界標準のCODEC(コーデック)「Opus(オーパス)」を、しかもほぼデフォルト設定で使っているようだ。さらに言うと、配信には既存の音声配信プラットフォームをそのまま使っている可能性が高い。

* OpusはIETFが開発しRFC 6716で標準化されている音声CODEC。幅広い通話、音声アプリ、音楽配信サービスなどでデファクトスタンダード的に使われている。
Clubhouseの構造
Clubhouseの構造
会話に参加できる「Speaker」とスピーカーたちの話を聞く「Audience」に分かれる(出所:著者、Clubhouseの画像はAppStoreの画面をキャプチャー)
[画像のクリックで拡大表示]

 つまりClubhouseはWeb音声アプリやオンラインゲームの音声チャットなどで使いつくされた既存技術を組み合わせて全く新しいユーザー体験を生み出している。現在の任天堂の基礎を築いた伝説のエンジニア横井軍平氏の哲学「枯れた技術の水平思考」を、そのまま実践したのがClubhouseの本当のすごみだと筆者は考える。