ヤフー株式会社、Hadoop からのデータ読込時間が半日から数分へ セルフサービス分析で部門の意思決定を支援


かつてヤフー株式会社では、社員がデータを分析する必要がある場合、データサービス本部にレポートをリクエストする必要がありました。データサービス本部では SQL クエリを使って同社の Hadoop 環境からデータを引き出していました。このプロセスには最大で半日かかり、レポート作成の待ち時間も長くなっていました。

今では、ユーザー自身が数分で Hadoop から Tableau にデータを読み込めるようになり、データの可視性の向上とコストの削減につながっています。

「一番はビジネスユーザーが直接データを触れることだと思います」と語るのは、データ & サイエンスソリューション統括本部データサービス本部でリーダーを務める寺田幸弘氏です。「以前は、データを直接触ることができなかったために、ビジネスユーザーがエンジニアに SQL の実行を依頼し抽出してもらうという、コミュニケーションコストが発生していました。ですが、ビジネスユーザーが Tableau を使えるようになったことで、そのコストなしに取りたいデータを簡単に自分で取り出せるようになりました」

Tableau を使用して、社員は数値を深く掘り下げ、その値がビジネスにもたらす影響を見ることができます。そして、問題の根本的な原因を見出し、そのインサイトを使ってより戦略的な意思決定を行うことに、リソースを集中できるようになりました。

「以前はデータを取り出して数値しか見ていない状態だった」と、データ & サイエンスソリューション統括本部データサービス本部の平林和也氏は述べています。「今はそのデータがどんな意味を持ち、どんな価値があるのかということを知ることができるようになりました。この変化が自分にとって大きなインパクトだったと思います」

「高速にデータを使い新しいインサイトを得るということに自分のリソースを集中できるようになりました。これが、ものすごく良くなった点です」

社員は、会社の新しいセルフサービス手法に満足しています。また、データサービス本部で戦略的なプロジェクトにかけられる時間が増えたうえ、ビジネスユーザーもデータにアクセスしやすくなり、よりクリエイティブな問題解決につながっています。