PR

完全に重複するデータを見つけ出す

 次にもう少し複雑なケースについて考えてみよう。下図は書籍管理のシートで、「管理番号」「著者」「タイトル」から成る。このような場合、著者は重複しても問題ないし、著者が違ってもタイトルが同じ本もあるから、タイトルが重複しても構わない。よってこの場合の重複データとは、「著者」「タイトル」とも同一のレコードとなる。

 重複データの有無を確認する場合、表全体を選択して、先の要領で「条件付き書式」の「重複データ」を設定する。次に、同じく先の要領で表の見出しに「フィルター」ボタンを付け、「タイトル」「著者」の順で「昇順」の並べ替えを実行する。さらに「タイトル」「著者」それぞれの「フィルター」ボタンで、「色フィルター」から強調表示の背景色を選ぶ。これで「著者」「タイトル」とも同一のレコードが上下に並び特定しやすくなる。

「著者」「タイトル」とも同一のレコードを特定
「著者」「タイトル」とも同一のレコードを特定
「重複データ」と「フィルター」ボタンの「色フィルター」を用いて、「著者名」「タイトル」とも同一のレコードを上下に並ぶようにした
[画像のクリックで拡大表示]

重複データを削除する

 重複データは手作業で削除してもよいが、データ量が多いと大変だ。次の方法を用いるのがよい。

 まず、「ホーム」タブの「並べ替えとフィルター」ボタンから「フィルター」を選んで、フィルター機能をオフにする。次に表全体を選んで、「データ」タブの「重複の削除」ボタンをクリックする。すると、「重複の削除」ダイアログボックスが表れる。

 ダイアログボックスの「列」を見ると、「管理番号」「著者」「タイトル」それぞれにチェックが入っている。この設定だと、3項目とも完全に同一のレコードが削除対象になる。今回の場合、「著者」と「タイトル」が同一のものが削除対象だ。よって、「管理番号」のチェックを外してから「OK」ボタンを押すと、重複データを削除できる。

「重複の削除」の活用
「重複の削除」の活用
「データ」タブ→「重複の削除」で「重複の削除」ダイアログボックスを開いたら、「管理番号」のチェックを外す。チェックしたままだと正常に削除できない
[画像のクリックで拡大表示]
ナカノアキラ
プランニング・ファクトリーサイコ
1962年、滋賀県生まれ。歴史、経済経営、情報の3分野で執筆する。主な著書に『超一流のアイデア力』(日経BP社)、『IT全史──情報技術の250年を読む』『幻の五大美術館と明治の実業家たち』(祥伝社)、『流出した日本美術の至宝』『世界漫遊家が歩いた明治ニッポン』『裸はいつから恥ずかしくなったか──「裸体」の日本近代史』(筑摩書房)、『超図解「21世紀の哲学」がわかる本』(学研プラス)などがある。オフィシャル・サイトはhttp://www.pcatwork.com