全3925文字
PR

 米Amazon Web Services(アマゾン・ウェブ・サービス、AWS)のSwami Sivasubramanian(スワミ・シヴァスブラマニアン)バイスプレジデントが2022年11月30日(米国時間)、年次イベント「AWS re:Invent 2022」に登壇し、データベース(DB)や機械学習に関連する新サービスや機能を発表した。データ基盤の使い勝手を向上したりデータのガバナンスを強化したりする機能が中心で、ユーザーが機械学習の知識なしに利用できるAI(人工知能)サービスの発表はなかった。

 AWSは以前からクラウドにおけるコスト最適化を図るための設計原理として「力仕事に費用をかけるのはやめよう」を掲げている。今回の基調講演でもこの原理の通り、DBやデータ分析に関する「ユーザーの重荷」を解消するサービスを発表した。

「AWS re:Invent 2022」に登壇したAWSのスワミ・シヴァスブラマニアン・バイスプレジデント
「AWS re:Invent 2022」に登壇したAWSのスワミ・シヴァスブラマニアン・バイスプレジデント
(写真:日経クロステック)
[画像のクリックで拡大表示]

 「データによって将来の基盤を構築すること、組織を結合させること、適切なツールと教育でデータを民主化すること」──。シヴァスブラマニアン・バイスプレジデントは基調講演の冒頭で、顧客のデータ戦略がこの3つの核で構成されていると強調し、それぞれに向けた新機能を紹介していった。

DWHがミッションクリティカルに

 1つ目の核である「データ基盤の構築」ではまず「Amazon Redshift Multi-AZ」を発表した。データウエアハウス(DWH)のサービスであるAmazon Redshiftはこれまで、1つのアベイラビリティーゾーン(AZ)にしか配置できなかった。複数のAZに配置することで冗長性を高める。あるAZで障害が発生した場合には自動的に他のAZに切り替わるため、データ分析などを継続できる。

 シヴァスブラマニアン氏は「DWHがミッションクリティカル(業務遂行に必要不可欠な要素)になってきており、当社のDBサービスと同等の信頼性が求められている」と話し、顧客からの強い要望があった機能だとした。

データベースのセキュリティーを強化

 「Amazon GuardDuty RDS Protection」はDBのセキュリティーを強化する新機能だ。脅威検出サービスであるAmazon GuardDutyをリレーショナルデータベース(RDB)のサービスである「Amazon Aurora」に対応させた。機械学習ベースのアルゴリズムが、DBに対する不審なアクセスパターンなどを検出する。GuardDutyのコンソールで簡単に検出機能を有効化できる。

 「Trusted Language Extensions for PostgreSQL」もDBのセキュリティーを強化する仕組みだ。オープンソースのRDBであるPostgreSQLに対応する拡張機能を、信頼できるプログラミング言語でのみ開発できるようにするツールで、AWSがオープンソースとして公開した。

 シヴァスブラマニアン氏は信頼できないプログラミング言語でPostgreSQLの拡張機能を開発することを、「難攻不落の要塞を築きながら、(その要塞の)鍵を玄関に置くものだ」と例えた。今回発表したツールを使うと、拡張機能を開発できるプログラミング言語をJavaScript、Perl、PL/pgSQLなどに限定できる。またDB管理者は拡張機能によるDBへのアクセス許可などを、拡張機能をインストールしたり実行したりするユーザーに応じて制御できる。

 セキュリティー強化に加えて、DBの使い勝手を向上させる新サービスも発表された。

 例えばドキュメントDBである「Amazon DocumentDB」のリソースを拡張する「Amazon DocumentDB Elastic Clusters」を発表した。ペタバイト規模のデータが格納可能であるほか、読み書き性能も数百万回/秒まで拡張できる。インフラはAWSが管理するため、ユーザーはデータ量に応じたインスタンスの追加などの作業が不要だ。

SparkワークロードをAthena経由で実行

 「Amazon Athena for Apache Spark」は、Amazon S3に格納されたデータに対してSQLクエリーを発行して分析できるクエリーエンジンのサービスであるAmazon Athenaの拡張機能だ。オープンソースの分散処理ソフトウエアであるApache Sparkのワークロードを、Amazon Athenaを介して、Amazon S3上のデータに対して適用できる。

 つまりユーザーはSparkのサーバークラスターやストレージを用意しなくても、Amazon AthenaとAmazon S3だけを使ってSparkのワークロードを実行できるようになる。