データウェアハウスとは?言葉の意味や役割をわかりやすく解説

最終更新日 

企業がビジネスを行う上で獲得してきたさまざまなデータは貴重な財産であり、過去のデータに基づいて効果的な意思決定ができるようになるため、適切な保管、活用が望まれます。

適切なデータ分析、活用を行うためにはデータウェアハウスを利用することをおすすめします。

本記事ではデータウェアハウスについて、基本的な意味や混同されがちな用語との違いについて、活用事例などを紹介しますので参考にしてください。

データウェアハウスとは?

データウェアハウス(DWH)とは、Data Ware Houseのことで、経営や組織としての意思決定に活用するビッグデータのことを指します。

データウェアハウスという概念自体は最近のものではなく、1980年代ごろからある概念です。

イメージとしては、さまざまなシステムが得たデータを保存し、それを効率的に分析するために整理するデータ保管倉庫と考えてもらうとわかりやすいでしょう。

データ管理はその量が増えるほどに複雑化し、目的のデータを探すことはもちろん蓄積された古いデータの削除にかかる手間も発生していました。

このような問題があることからデータを経営の意思決定に活用するにはハードルが高いものとなり、なかなかうまくデータ活用ができないというケースは少なくありませんでした。

データウェアハウスが登場したことで、大量のデータを効率的に整理して必要なデータを手軽に抽出、保存して従来の課題を解消できるようになりました。

昨今のビッグデータ活用にデータウェアハウスは欠かせないものとなっています。

データウェアハウスと混同しがちな用語との違いについて

データウェアハウスと混同されがちな用語として、「データベース」「データマート」「データレイク」という言葉が挙げられます。

それぞれの用語とデータウェアハウスとの違いについて解説します。

データベースとの違い

データウェアハウスとデータベースの大きな違いはそもそもの役割にあります。

データベースは、データの保存や編集など豊富な機能を持ち、データの分析に特化したものではありません。

一方で、データウェアハウスはデータの分析に特化しており、各システムごとのデータを分析しやすいように時系列で整理したりサブジェクト別に整理することができます。

通常、データベースは行単位でデータの読み込みを行うため列による選別が得意ではありません。

データウェアハウスであれば列単位でデータの読み込みができるため、不要な列の情報を読み込まないで必要なデータをピンポイントに抜き出すことが可能です。

データマートとの違い

データウェアハウスとデータマートは分析対象の範囲において違いがあります。

そもそも、データマートとは目的に沿って作成したデータベースのことを指します。顧客にメルマガを送る際に地域とメールアドレスだけを抽出したデータなどがデータマートにあたります。

データマートの構築は比較的簡単で、必要な項目を抜き出してデータベースを作成する感覚で実行でき、必要な情報だけを見ることができるため分析も容易という特徴があります。

しかし、データウェアハウスと違い分析の対象が狭いので全体的なデータを統合して分析することには向きません。

データレイクとの違い

データレイクもデータウェアハウスもビジネスアナリティクスの目的で構築されているという点では違いがありません。

ですがデータレイクは全てのデータソースのローデータ、構造化データ、非構造化データをネイティブ形式で収納して、活用するときまで保管するのに対し、データウェアハウスはレポートやデータ分析にすぐ活用できるようにファイルやフォルダにデータを編成して保管するため、この点に違いがあります。

データウェアハウスの活用事例

CRMにおけるデータ活用

顧客管理システム(CRM)へのデータ活用にデータウェアハウスが用いられることがあります。

CRMを導入することで、データに基づいた顧客管理が可能となり、より密接な顧客との関係を構築でき顧客満足度の向上が期待できます。

CRMに特定の顧客情報、たとえば購買履歴のデータを取り込みたいという場合には、データウェアハウスであれば時系列、目的で過去の履歴をすぐに検索して分析、どのような顧客が購買意欲が高いのかをすぐに把握できるでしょう。

データウェアハウスは1つのシステムに関するデータを分析するのではなく、さまざまなシステムのデータを横断的に把握してプロセスごとに分析できるため、CRMの活用もより効果的になります。

大規模ECサイトにおける活用

大規模ECサイトの運営におけるデータウェアハウスの活用としては、日々更新される大量の出品情報を蓄積·分析するための基盤としてデータウェアハウスを導入した事例があります。

購買者経験の分析や出品者経験の分析、収益管理、不正行為の監視、顧客対応管理などの業務でデータウェアハウスを活用して、全体的な視点から顧客の行動を把握できるようなりました。

コストも個別にデータ管理を行うより抑えることができたという結果もでています。

航空券の予約システムにおけるデータ活用

航空券の予約システムにおいてもデータウェアハウスを活用した事例があります。

航空券の予約は急なキャンセルなど不確定な要素があることから、空席を減らしちょうど満席することは難しいものです。

この課題に対してデータウェアハウスを導入することで、顧客一人ひとりの利用履歴を確認して分析することでキャンセル傾向などが分析可能となります。

顧客のキャンセル予想率が導きだせることで空席を減らし、売上損失を回避することができます。

データウェアハウス構築に関連する製品・サービス

データウェアハウスにおけるデータ構築を行うサービスについて紹介します。

AWS(Amazon Web Service)のデータ蓄積に関するサービス

  • S3:データの耐久性が非常に高く、万が一のことがない限りデータの消失がないことが特徴です。
  • RedShift:行ではなく列で分析することができるデータベースサービスです。分析力が高いという特徴があります。

Azureのデータ蓄積に関するサービス

  • Azure Blob Storage:Az Copyという機能を用いることで、S3などのストレージからデータをインポートすることができます。

GCP(Google Cloud Platform)のデータ蓄積に関するサービス

  • CloudStrage:GCPのブロックストレージサービスです。
  • BigQuery:データウェアハウスに必要なデータの蓄積や加工、分析が1つのサービスで実現できます。ストレージ容量も無制限と利便性にも優れています。

データウェアハウスの構造を理解して、経営の意思決定にデータを活用しよう

データウェアハウスについて基本的な意味や混同されがちなデータベース、データマート、データレイクとの違い、活用事例などを解説しました。

企業が利用している既存のシステムが蓄積したデータを統合的に保管して管理、効率的かつ横断的な分析ができることからビッグデータの活用にデータウェアハウスの導入は欠かせないものとなるでしょう。

実際に、世界の多くの企業ではデータウェアハウスを取り入れてビジネス課題の解消に活用している事例が増えています。

本記事で紹介したデータウェアハウスの構築に関連するサービスも参考にして、ぜひ自社の経営にビッグデータの活用を取り入れてみてください。

    執筆者  STRATE編集部

    リード情報をお求めの企業様へ
    STRATE[ストラテ]に貴社サービスを掲載しませんか?

    まずは無料で掲載