トップ > 技術コラムNews > SAP技術情報 > 「SAPに集約されたデータの活用方法」NO.3データウェアハウスはもう古い?SAPデータはデータレイクで管理

更新日 

「SAPに集約されたデータの活用方法」NO.3データウェアハウスはもう古い?SAPデータはデータレイクで管理

はじめに

近年はデータを活用する方法としてデータレイクやデータウェアハウスが活用されています。一時期はデータウェアハウスがブームでしたが、データレイクも存分に活用されている状況です。

 

SAPのデータを活用するにあたっては、データウェアハウスよりもデータレイクをおすすめします。今回はデータウェアハウスではなくデータレイクで、SAPデータを管理したり活用したりすることについて解説します。

1.SAPデータを活用する重要性

SAPは基幹システムと呼ばれるもので、企業の非常に重要なデータが含まれています。部分的には不適切なものが含まれるかもしれませんが、分析することで企業経営に役立てられることが大半です。例えば、新しい販売チャネルを検討したり新製品を検討したりできます。

 

このような検討にあたっては、SAPデータを活用しない選択肢も考えられるでしょう。例えば、現場からヒアリングして情報を収集することが可能です。ただ、このような情報は収集に時間を要してしまうため、積極的な採用は望ましくありません。

 

それに対して、SAPを中心とした既存のデータを活用すれば改めてデータを収集する必要がなくなります。つまり、手間をかけることなく経営などに活かせる情報が手に入るのです。SAPはデータの宝庫であるため、このデータを活用することには大きな意味があります。

2.データレイクとデータウェアハウス

データ活用の仕組みにはデータレイクとデータウェアハウスがありますが、これらの違いは正しく理解されていません。まずはそれぞれの活用方法がどのようなものであるのか解説します。

2-1.データレイクとは

データレイクはとにかくデータを集約する環境を指します。倉庫のようなものをイメージするとわかりやすく、大量の情報がとにかく格納されるものです。情報の格納場所を分散させると検索に手間がかかる可能性があるため、データレイクを使用します。

 

特徴として、データレイクは生の情報を格納することが挙げられます。必要以上に情報を加工せず、ユーザーが登録したままの状態で格納するのです。SAPに情報が登録されたならば、その情報をそのままデータレイクにも格納します。

 

生のデータが手に入るため利便性は高いですが、とにかくデータを格納するため行方不明になるリスクがあります。データを格納しすぎて「SAPから取得したほうが早い」という状況にもなりかねません。良くも悪くも生のデータを格納する環境だと理解しましょう。

2-2.データウェアハウスとは

データウェアハウスはSAPなどの基幹システムから提供された情報を格納する仕組みです。ただ、データをそのまま格納するのではなく、ユーザーが利用しやすい状態に加工してから格納します。また、必要に応じてデータを分析することも可能です。

 

事前に加工や分析が済んでいるため、データウェアハウスの情報はユーザーが活用しやすい状況です。しかし、事前に情報の加工や分析が必要となるため、専用のソフトウェアなどが求められます。ここにコストが発生してしまうため注意しなければなりません。

 

また、事前にデータを加工していることから、想定外の用途には利用しづらくなってしまいます。想定した目的に対しては素早く情報が手に入りますが、想定できていない場合は利便性が悪くなってしまうのです。

3.なぜデータレイクやデータウェアハウスが必要なのか

データレイクやデータウェアハウスの概要を理解すると「なぜSAPとの連携が必要なのか」という疑問が湧いてくるでしょう。続いてはこれについて解説します。

3-1.SAPはエクスポートして利用しにくい

SAPのデータ活用においてデータレイクやデータでハウスが必要な理由は「直接データを利用しにくいから」です。SAPが保有するデータは、SAPの製品群内では利用しやすいですが、それ以外では利用しづらくなっています。この問題を解決するために、データレイクやデータウェアハウスが必要となるのです。

 

例えば、SAPのデータはSAPで処理しやすいような桁数などに制御されています。これをアプリケーションで加工して表示させる仕組みです。このような情報はそのままでは利用しにくいため、これらのアプリケーションに連携して効率よく活用します。

 

また、そもそもSAPのデータはエクスポートしての活用がしづらいものです。この問題を解決するという観点でも、データレイクやデータウェアハウスが役立ちます。

3-2.複数のシステムが混在する

SAP以外にも複数のシステムが存在するため、データを集約する意味があります。SAPを基幹システムとして周辺システムが多数存在する場合は、集約しなければデータを活用できないでしょう。

 

データが点在しているとデータの収集に時間を要してしまいます。情報を集めてから加工や分析をするため、さらに時間を要するのです。データが分散している方が良いこともありますが、分散していない方が良いことが多いでしょう。

 

データレイクやデータウェアハウスは分散したデータの活用に役立ちます。SAP以外のアプリケーションも導入している企業が大半だと考えられるため、状況を大きく改善できるでしょう。

 

なお、SAPの製品群にもSAP BW/4HANAと呼ばれる製品があります。他社の製品を導入せず、SAPに情報を集約して活用することも可能です。

4.SAPとデータレイクを組み合わせたデータの活用フロー

SAPのデータはデータレイクに連携することでさらに活用可能です。具体的にどのようなフローで連携してデータ活用すれば良いのか解説します。

4-1.データ品質の向上

データレイクに情報を連携して活用するためには、データの品質向上が重要です。データレイクはSAPを始めとして生のデータが格納されます。品質の悪いデータが格納されてしまうと、「ノイズ」になりかねません。

 

データの品質向上を実現するためには、システム利用者の意識改善やシステム改修が重要です。ノイズとなるようなデータを削除したり入力させたりしないことで、品質が改善されます。また、データレイクへの連携を意識してシステム側の制御を強化することも可能です。

 

なお、「品質の向上」という言葉の解釈は難しいでしょう。半角と全角を揃えることも、データの入力内容を見直すことも該当します。解釈がブレやすい部分であるため、自社に適した解釈が重要です。

4-2.データの整合性担保

データレイクを導入するにあたっては、データの整合性を意識しましょう。整合性が取れてないと異なったデータとして認識され、SAPのデータが上手く活用できません。

 

整合性を担保するための活動は多岐にわたり、例えば以下が考えられます。

  • 全角と半角を揃える
  • 大文字と小文字を統一する
  • 「株式会社」など表記がブレる記載をルール化する
  • アルファベットとカタカナ表記を統一する

これらは一例であり、実際には多くの観点からデータの整合性を担保する必要があります。同じSAPをデータソースとする場合でも、部門や担当者によって記載が異なるケースは少なくありません。「実質的な同じデータ」はデータレイクの活用にあたって悪影響を与えるため、可能な限りなくしておきましょう。

4-3.データレイクの構築

データの整合性を担保する作業と並行してデータレイクを構築しましょう。データレイクにはいくつもの製品が存在するため、それらの製品を導入する前提で進めることをおすすめします。

 

具体的な製品の導入にあたっては使い勝手やコストなどを満遍なく評価しなければなりません。企業によって適切なデータレイクは異なっているため、いくつも比較して製品を選定するようにしましょう。

4-4.データレイクをソースにしたデータ活用

SAPのデータが無事にデータレイクへと連携されるようになれば、これをソースとしてデータ活用できます。データレイクはSAP以外のデータも集約できる環境であるため、できるだけここに集約してデータを活用しましょう。

 

データレイクは加工されていないデータが格納されていることから、幅広いデータ活用が可能です。SAPでは負荷を鑑みて処理できなかった内容でも、データレイクに連携すれば処理しやすくなるでしょう。データウェアハウスのように特定の用途に特化した加工がなされていないため、必要な形へと自由にカスタマイズ可能です。

5.SAPのデータ活用で注意するべき2つのポイント

SAPのデータ活用ではいくつものポイントがあります。それらのポイントの中で特に重視してもらいたいものをピックアップして解説します。

5-1.データの集約がゴールではない

SAPに集約されたデータをデータレイクやデータウェアハウスで活用したいと考える企業は多くあります。そのような思いが実現して、上記で紹介したようなシステムが導入されるケースは多くあるのです。

 

ただ、この時に理解してもらいたいのは、システムの導入がゴールではないことです。システムの導入に全力を注ぎ燃え尽きるケースが見受けられますが、システムを導入するだけでは意味がありません。SAPのように大量のデータを持つアプリケーションを活用して、データを分析することが重要です。

 

また、さらに深掘りするならば、分析したデータを経営に活かすことがゴールといえます。専門的なスキルが必要となり、分析だけで満足しがちですが、それだけでは意味がないのです。SAPのデータを活用し、何かしら経営の改善につなげることがゴールだと考えましょう。

5-2.社内への浸透を心がける

SAPのデータからデータウェアハウスを構築する際は、システムの利用が社内に浸透するような活動が必要です。時間とお金をかけてシステムを構築するものの、社内で浸透せず使いこなされていないケースは多く見られます。このような状況になると多くのものが無駄になってしまうため、できるだけ避けなければなりません。

 

社内でこのようなシステムを浸透させるためには、構築から関連部署に協力してもらうことが重要です。it部門だけで構築を進めてしまうと「どのようなシステムを構築しているのかわからない」との状況になってしまい、システムを使いこなしてもらうことができません。

 

また、使い方の事例について共有することも重要です。SAPを活用している部門に対して、現在のSAPデータからどのようなことが分析できるのか紹介しましょう。多くの場合実例を示してあげることで状況が把握しやすくなり、より活用してもらいやすくなります。

まとめ

SAPとデータレイクやデータウエハースを組み合わせることによるデータ活用について解説しました。SAPは基幹システムであり多くの情報を保有しているため、これらの製品と組み合わせることでさらにデータを活用できます。データをしっかりと分析できれば、経営の改善などに役立てられるでしょう。

 

ただ、データの活用がゴールではなく、システムの導入がゴールになっている事例が見受けられます。これは本末転倒であるため、最終的なゴールを誤ってはなりません。

LINEで送る
Pocket

SAP案件紹介や独立前相談

ほとんどのSAPコンサルタントの方は、独立すると、まずは当社へご登録いただいております。

60秒で無料登録

案件情報やSAP技術情報を
気軽に受け取る

メルマガ登録

つの情報を送るだけで案件紹介へ

    御氏名
    メールアドレス
    電話番号
    生年月日

    つの情報を送るだけで案件紹介へ

      御氏名
      メールアドレス
      電話番号
      生年月日