全2365文字
PR

 コンテナ管理ツールのKubernetesによってマルチクラウドを実現する――。筆者はこれまでITベンダーによるそのような主張を、冷ややかな目で見てきた。しかし米Google(グーグル)が2020年7月に発表した新サービス「BigQuery Omni」は、筆者の見方を逆転させてくれた。本物のマルチクラウドが、いよいよ到来しそうだ。

 グーグルが2020年7月14日に発表したBigQuery Omniは、Google Cloud Platform(GCP)のデータウエアハウス(DWH)サービスであるBigQueryを、Amazon Web Services(AWS)やMicrosoft Azureでも利用可能にするサービスだ。BigQueryのクエリーエンジンであるDremelがAWSやAzure上で動いて、AWSやAzureに保存されたデータを処理する。ユーザーはAWSやAzureにあるデータをGCPにコピーしなくても、BigQueryが使えるようになる。

 BigQuery Omniのシステム一式は、グーグルがAWSやAzureの上に構築したKubernetes環境で動かす。グーグルは2020年4月、GCP以外のパブリッククラウドやプライベートクラウドにKubernetes環境を構築・運用し、その環境をマネージドサービスの形でユーザー企業に提供するAnthosというサービスを正式に始めている。BigQuery OmniもAnthosの仕組みを使っている。

 ユーザー企業はGCPと同じユーザーインターフェースやAPI(アプリケーション・プログラミング・インターフェース)を使ってBigQuery Omniが利用できる。システムの運用はKubernetesも含めてすべてグーグルが担う。サービスは現在アルファ版で、まずAWSで開始した。Azureへの対応については「近日中」とする。

BigQueryをBorgからKubernetesに移植

 筆者が長らく「Kubernetesでマルチクラウド」というシナリオに疑問を感じていたのは、BigQueryのようなクラウド事業者独自のサービスが他社のクラウドで利用できないからだった。

 これまでもKubernetesを使えば、アプリケーションを実行するコンテナ環境は複数のクラウド間で共通化できた。しかしユーザーがAWSやAzure、GCPといった大手パブリッククラウドを使う最大のメリットは、PaaS(プラットフォーム・アズ・ア・サービス)に相当する便利なサービスにあった。そうした独自サービスを使わずに、ピュアなコンテナ環境だけでマルチクラウドを実現しても意味はない。筆者はそのような考えから、Kubernetesによるマルチクラウドというシナリオに否定的だった。

 しかしグーグルはKubernetesを活用することで、同社独自のDWHサービスであるBigQueryをマルチクラウド対応にしてみせた。BigQueryはグーグルの独自データセンター管理ソフトである「Borg」上で稼働している。そしてグーグルがBorgをOSS(オープンソースソフトウエア)として公開したのがKubernetesだ。つまりグーグルはBigQueryをBorgからOSS版であるKubernetesへ移植して、BigQuery Omniを実現したわけだ。

 SQLクエリーを使ってペタバイト(PB)規模のデータを高速に分析できるBigQueryは、GCPにとって最大の強みである一方で「ロックイン」の懸念を招く弱点でもあった。グーグルとしてはマルチクラウドで使えるBigQuery Omniによって、BigQueryに対するユーザーの懸念を払拭できたことになる。