Tableauが仕事を進める中で話題にあがり、
BIツールってそもどもどんなもんじゃろと思い調べてみました。
その際、こちらの書籍を参考にさせていただきました。
データ分析とは?みたいな点に踏み込んだ内容もあったので、データ分析について自身が捉え直す意味も含め、流れに沿って整理してみました。
まずは「Tableauって?」という点と「Tableauでデータ分析する流れ」の概要をまとめてみました。
2019年6月のあたまにはSalesforceによる買収が報じられましたね。
Tableauってどんなソフト?
BIツールの一種。従来のBIツールと比べて、ビジネスユーザーが自らデータに接続し、素早く可視化することができるという特徴がある。
Excelとはコンセプトが異なる。
Excelは「セル単位で」データを捉えるのに対し、Tableauはデータの縦の「項目名(列)」単位で捉える。元データへの変更一切行わない。
Tableueはフランス語で「絵画・ボード」という意味。
ミッションは「Tableau helps people see and understand their data」。
Tableauは、人々が自身で考えていることをしっかり理解する手助けをしますよ、ということですね。
Tableauの特徴
他のBIツールとの違いは下記のような例があるとされている。
- 様々なデータに接続できる「セルフBIツール」である
- データの更新が簡単
- 可視化に優れている
ExcelやAccessとの違い
- 元データの変更はできない
-
セル単位ではなく、列単位でデータを扱う(ピボットテーブルに近い)
その他のTableauの特徴
-
SQLが動いているからこその動作
-
本格的な統計分析やデータマイニングには別の手段が必要
-
コミュニティが活発
Tableauによるデータ分析 7つのステップ
- 1.下準備
- 2.データに接続
- 3.中身を確認
- 4.フィールド名を「列」や「行」に配置する
- 5.フィルターで絞り込む
- 6.マークで効果を与える
-
7.ダッシュボードを作成する
-
共有する
それぞれ詳細を見てみる。
1.下準備
データ分析では6割、場合によってはそれ以上の時間がデータ準備に費やされると言われている。
また、データベースやETLツールなどを使い、事前にデータを準備しておく必要がある場合もある。
いざ、データ分析を行おうとした際はここでつまづく場合が多い。
2.データに接続する
実際に操作してみると…
↓
Tableauアイコンをクリック
「接続」画面になり、接続するデータを選択する
接続され、クエリが実行される
↓
左側には接続先のファイル名が表示される(接続したのがExcelファイルの場合、Excelファイルのシート名も表示されている)
更に、そのシートを右側の「ここにシートをドラッグ」と表示されている部分にもっていく。
↓
シートに接続され、格納されているデータの内容が表示される。
↓
この場面では複数の表を結合させたり、一つの列を複数の列に分割したり、「抽出ファイル」を作成したりできる
Tableauの特徴として、操作を元にもどせるというのがある。結果を恐れずいろいろ試してみるとよい。
3.中身を確認する
ワークシートが開かれる
↓
左の「データ」の「ディメンション」と、「メジャー」にあるフィールド名を、右の「列」や「フィルター」に配置することで分析を進めていく。
※ Excelのピボットテーブルと同じ要領
↓
左側のデータペインと呼ばれる「データ」の部分には「ディメンション」と「メジャー」に分類されて表示される
↓
「分析の切り口」と「集計対象となる数値」と適切に分かれているか確認!
↓
Tableauは基本、文字列や日付が入っているフィールド名を「ディメンション」・数値が入っているフィールド名を「メジャー」に分類する。
まれに、意図しない結果になることがあるので注意!
意図しない結果になった例
- 従業員番号や顧客コードが数値だったために「メジャー」に行ってしまった
- 顧客名が文字列だった為に「ディメンション」に。本来はこれでいいが今回は顧客名を数えたい為、「メジャー」にしたい
そのような場合は「メジャー」と「ディメンション」を入れ替えることができる。
データの型の確認と変更
フィールド名の前にアイコンがついていて、それぞれが「文字列」や「日付」など型を示している。
また、
色が青:不連続なデータ(家具、家電、事務用品など)
色が緑:連続なデータ(1、2、3など)
※日付は両方に入る場合がある
フィールドが数値の筈だが、文字列だと判断されてしまう場合は見えないスペースが混ざっている可能性などを考慮。また、強制的にデータの型を変更することもできる。
それぞれのフィールドに含まれるデータの確認
このフィールドにどのようなデータが入っているか確認する場合は見たいフィールド名をクリックし「説明」を選択する。
4.フィールド名を「列」や「行」に配置
データの確認がおわればいよいよ分析。
基本的な使い方は左側の「データ」ペインの「ディメンション」や「メジャー」のフィールド名を「列」や「行」に配置。「フィルター」でフィルターし、「マーク」で視覚的な効果で様々なグラフや表をつくること。
カテゴリごと、出荷日ごとの売上推移(グラフ)
カテゴリごと・出荷日ごとの売上推移をグラフで示す
↓
「ディメンション」から「カテゴリ」を「行」に配置する
ポイントは
- 「行」はグラフや表を縦に広げる
- 「列」は横に広げる
であること。
「カテゴリ」を「行」に → 「ピル」と呼ばれる薬のアイコンが配置され、表が縦に広がる。
ポイント!
「列」や「行」、その左にある「ページ」や「フィルター」の部分を「シェルフ」(棚という意味)と呼ぶ。
↓
「出荷日」を「列」に」配置。するとグラフが横に広がる
↓
「メジャー」から「売上」を「行」に配置する
↓
するといきなりグラフが現れる。
それは、Tableauが「元データにクエリを投げて「カテゴリ」別・「出荷日」別の「売上」を選択して表示しなさい、そのときに適切なグラフで表示させなさい」という命令をしたということ。
その結果、Tableauは「折れ線グラフがいいかも」と判断した。
想定と違う場合はグラフの種類を変更することができる。
「年」から「月」までの日付を詳細化してみる!
「列」に入れた項目を見ると小さな「+」ボタンができている。
これは、フィールドが階層化されていることを示している。
例えば日付データの場合、「四半期」、「月、「日」へと詳細の報告を進むことができ、これをドリルダウンという。
同様のことをグラフ年に合われる「+」をクリックすることでも行える。
シート名の付与
シート名をつけるには左下シートタブをダブルクリックして名前をつける
ポイント!
シートタブを右クリックするとシートに対しいろんな操作ができ、ファイルを越えてシートのコピー&ペーストなども実行できる
メニューバーの「ファイル」から「保存」を選ぶことで保存できる。
カテゴリごと出荷日ごとの売上推移(クロス集計表)の追加
まとめ
Tableauは人間の思考の流れ(フローという)を止めずに分析を進められるようにすることを重要視している。