全4549文字
PR

大規模データの取り扱いには「データベース」が欠かせない。データベースを操作するための言語「SQL」への理解も必要だ。簡単な英単語が分かれば、SQLでデータを抽出したり集計したりできる。

 今回は、大規模データを扱うときに欠かせない「データベース」について解説します。そのデータベースを操作するための言語「SQL」についても学びましょう。

 皆さんは、顧客や社内の誰かから、行数が数千万にもなる大規模なデータを受け取ったらどうしますか。データの容量が多すぎて、手元のPCの性能によってはファイルを開くことさえできないかもしれません。そんな大規模なデータはどのように処理したらよいでしょうか。

 そこで必要になるのが、データベースソフトウエアです。データベースソフトには取り扱うデータ構造などによって、いくつか種類があります。特にビジネス分野のデータ活用で利用されるのが、データを表形式で取り扱うリレーショナルデータベース(RDB)と呼ばれる製品で、有償のものからオープンソースの無料のものまで幅広く存在しています。

 有償のものには、米マイクロソフト(Microsoft)の「Access」「SQL Server」、米オラクル(Oracle)の「Oracle Database」などがあります。無料で使えるオープンソースであれば、「MySQL」や「PostgreSQL」などが代表的です。

 最近ではAWS(Amazon Web Services)やGoogle Cloudといったクラウドベンダーが独自のデータベースを開発し、提供する例も増えています。

データベースとは何か

 データベースとは、登録や検索、更新、削除が容易にできるように整理されたデータの集合のことです。企業情報システムで最も広く使われているのがRDBです。ここでは、RDBを対象に解説します。イメージをつかむために、RDBに格納されたデータの例を見てみましょう。

図 リレーショナルデータベース(RDB)のデータの例
図 リレーショナルデータベース(RDB)のデータの例
Excelなどの表計算ソフトに見た目は似ている
[画像のクリックで拡大表示]

 「Excelと似ている!」と思った方も多いと思います。多くのデータベースソフトでは、表計算ソフトによく似た見た目でデータを表示します。

 構造もよく似ています。Excelは1つのファイルに複数のシートがありますが、データベースソフトも同様に1つのデータベースの中に複数のテーブルがあります。テーブルというのは、Excelのシートに該当します。このテーブルの中に実際のデータが格納されているというわけです。

図 RDBのテーブルの例
図 RDBのテーブルの例
「user_master」テーブル
[画像のクリックで拡大表示]

 一方で、Excelと異なる点もあります。その違いを確認しながら、データベースについての理解を深めていきましょう。