データ活用の秘訣を料理に例えて解説! データ整理整頓のコツとは? :Domopalooza 2023レポート
アタラ合同会社の村田です。
SaaS型データ活用プラットフォーム「Domo」を提供する、ドーモ株式会社が主催するカンファレンス「Domopalooza 2023」が、2023年3月30日(日本時間)にオンラインで開催されました。
多種多様な業界のDomoユーザー企業が登壇したセッションでは、データ活用の事例や今後の業界展望等、さまざまな話題が取り上げられました。
その中の一つ、「Data is Like Cooking: How to Keep a Clean Kitchen」では、Dashboard Dudesの代表・John Le氏が登壇し、Domoのデータをより扱いやすくするためのTIPSが紹介されました。
セッションの動画はこちら。
※本記事内の画像は、特記のないものは上記リンクのセッション動画の画面キャプチャです。
「データは料理のようなもの」とし、データの活用・加工のプロセスを調理工程にたとえ、より便利にするためにLe氏が取り組んでいるポイントが語られました。とてもキャッチーなタイトルの通り、Domo初心者のみでなく、Domoを使用していない方にとっても非常にわかりやすくデータ活用のコツが学べる内容でした。
Domoに限らずBIツールをお使いの方や、BIツールの導入検討をされている方にぜひ参考にしていただきたく、今回の記事ではセッションの内容を要約しお伝えします。
本セッションのポイント
セッションでは以下の3つのポイントが重要であるとし、それぞれの具体的な活用アイデアが紹介されました。
データセットの命名規則
データセットのタグ付け
ETLのクリーニング
データセットの命名規則
Domoには、可視化するための元データとなるデータセットを一覧管理をする機能があります。
保持しているデータの数が増えると、似た項目を持つデータセットが多くなり、必要な情報にアクセスするのが難しくなってしまいます。
必要なデータがすでにDomoの中にあるにも関わらず、見つけ出すことができなくなる。そして再利用可能なものがすでにあることに気づかず、ゼロから新たにデータの作成を行うことになる。その結果無駄に手間がかかるだけでなく、類似データや重複データが増え、さらに見分けがつかなくなる。そんな悪循環に入ってしまうのです。
そうした問題を解消するため、Le氏はデータセットに対し、ルールに則った命名を行うことを推奨しています。
TIPS
①データセットの名前に区切りを入れて、組織・ソースの種類・内容の概要をデータセット名に記入する
一見、データセット名が長くなり扱いづらくなりそうですが、文字で検索する場合には、より多くの情報をデータセット名の中に入れておくことが必要とのこと。
②データセットの一覧を独自に作成し、細かな分類を確認できるようにする
①で区切りの付け方をルール化しておくことで、データセット名の記入内容を項目として取り出し、分類することもできます。こうしたデータカタログを作っておくことで、より便利に必要なデータを探し出すことができます。
③略語を使わない
Domoは誰にでも使いやすく・わかりやすくしておく必要があるという考えから、専門家にしか理解できない略語を使わないことを心掛けているとLe氏はいいます。
例えば、「GA」という略語を目にしたとき、WEBマーケティングに理解のある方なら「Google Analytics」のことだとすぐに理解することができますが、詳しくない方には何のデータであるかは理解できません。それどころか、「GA」と略せる別のものを連想してしまう可能性もあります。このようなことを防ぐため、略さず正式な名称を記入することが大切と語りました。
料理に例えると:保管場所のグルーピング
料理をする際にも、必要な道具や材料をすぐに取り出せるようにキッチンを整理整頓しておくことが大事です。Le氏は「データセットの命名に規則をつけることは、パントリーの整頓と同じ」とし、命名規則で種類や要素を分かりやすくして、必要な時にすぐ取り出せるようにしておくことが大事と語りました。
データセットのタグ付け
これは命名規則にも近しいTIPSだと筆者は感じましたが、データセットの分類をタグで管理することも有効であるとLe氏は紹介しています。
Domoにはデータセットにタグをつける機能がありますが、Le氏曰く「タグ付けは使っていない人が驚くほど多く、過小評価されている機能」とのこと。
TIPS
①データセットの用途をタグで記入する
データソースの元となっているクラウドサービスやファイルは、Domoのデフォルトの検索機能として存在しており、またデータの内容についての詳細な情報はデータセット名から判断ができます。
その上で、「トレーニング用」「管理者用」「営業部用」「本番用」「検証中」など、どのような用途で使うべきものかを目印としてつけておくことで、組み合わせでの検索が一気に便利になる、とのことです。
②組み合わせてフィルタリングする
さきほど紹介した通り、データセット名からは組織・ソースの種類・内容を判断できます。また、Domoの機能でデータのタイプが各データセットには自動で付与されます。この2点で補いきれない要素を、タグによって判断することができます。逆に言うと①の段階で、不足している情報や、あったら便利な分類を考慮して必要なタグの種類をつくる必要があるかもしれません。
料理に例えると:小麦粉と砂糖をラベルで区別する
データセットの命名規則ですでに保管場所のグルーピングをすることはできていますが、さらに詳細な分類の目印をつけておくことが必要です。
例えるなら、タグ付けは小麦粉と砂糖を区別するラベルのようなもの、とLe氏は紹介しました。たしかに一見するとどれも白い粉で、使い慣れている人にとっては分かる違いかもしれません。ですが多くの人が使うこと、初めて使う人にも分かりやすくしておくことを考えると、タグによる目印付けはとても親切な配慮といえます。
ETLのクリーニング
DomoにはMagic ETLという特徴的な機能があります。プログラミングの知識がなくても、操作タイルを使い簡単にデータ加工ができる、とても便利な機能です。しかし使いやすい分、たくさんのデータ処理フローが作られ、後から見返すとどんな加工をしているのかがわからなくなってしまうことも非常によく見かけます。これもデータセットに似た悩みですが、この問題を解消する工夫が紹介されました。
TIPS
①タイルは列ごとに整理して並べる
操作タイルと矢印を繋げてETLを作成する際、交差がないように整理して並べることが肝要とのこと。
ぐちゃぐちゃとわかりにくい書き方をしているコードのことを、プログラミングの世界では“スパゲティ・コード”と呼びますが、まさに絡まったスパゲティのようなフローにはするべきではない、ということです。
②工程ごとに色を付ける
整理して並べることに加えて、フローの矢印の色を変えることで、さらに楽に見分けられるようになります。
③メモを付ける
加工している内容の詳細を、文字で説明できるメモ機能をきちんと活用することもオススメです。
作成している時には理解できていたとしても、過去に自分が作成したものを見返してみると思い出せなくなってしまう、というのはよくあることです。他人が作ったETLを確認する際にはさらに理解が難しくなります。
作成する際にメモをつけていくことは非常に面倒ですが、後々見返す時にとても役に立つので、これはぜひ心掛けてほしいポイントです。
料理に例えると: 調理工程を示すレシピ
ETLのタイルはアイコンによって、どのような操作かが明瞭に分かるようになっています。それはたとえるなら「皮をむく」「包丁で切る」「茹でる」などの調理の作業を示すもので、それらの流れを示したETLフローは調理工程を示すレシピと言えるでしょう。
他の人が見ても理解でき、真似して料理を作れるようになる。または、昔自分で作った料理の作り方を忘れないようにする。そんなレシピ作りをするイメージでデータフローを作ると、便利になるだけではなくとても楽しみながら作業を進められるなと感じました。
Le氏からのガイドページのプレゼント
「Domopaloozaを見てくれた人だけの特別プレゼント!」として、Le氏の所属するDashboard Dudesが提供しているガイドページが限定共有されました。
コピー&ペーストして使うことのできる、Beast Mode(=コードを書いてデータ加工を行う機能。計算フィールドのこと。)のコードのフォーマットや、どのチャートを使えばよいかを考える助けとなる全チャートのサンプル一覧など、非常に便利なガイドが共有されました。
初心者向けのガイドとしてとても役に立つものなので、自社のDomoページ内に同様のガイドを作成してみるのはいかがでしょうか。
※ページのアクセス権の配布は、Domopaloozaでのセッション公開後期間限定で行われており、本記事公開日時点ではアクセスできなくなっています。
おわりに:筆者の感想
データの処理工程を料理にたとえ、わかりやすく理解できるように説明されており、非常に楽しくセッションを視聴することができました。
Domoはデータの専門家のための分析ツールではなく、初心者にも使いやすいビジネスツールです。もう一歩拡大解釈をして言い換えると、データからなにかの情報を解釈して伝達するためのコミュニケーションツール、と言っても大袈裟ではないかもしれません。
料理の工程においても誰もが使いやすくするためにキッチンを整えておくこと、作り手とのコミュニケーションを円滑にするためにレシピを整えておくことが大切なのだと、面白く学ぶことができるセッションでした。
データを扱いやすくするためにどうしたらいいのかお困りの方は、ぜひ本記事の内容と、セッション動画を参考にしてみてください!
BIツールの活用やデータ活用を推進しよう
データ活用を進めたいが、データを集めることに課題がある
データ活用を組織に定着させるためのノウハウがない
見るべき指標が複雑・多様化していて、どれを見ればよいのかわからない
ビジネス課題解決のための指標を可視化し、すぐに判断したい
という方は、まずはライトな相談から。支援内容の詳細とお問い合わせはこちらからどうぞ。