Eye-catching Canvas dashboards on top of bike sharing data | Elastic Blog
ユーザストーリー

自転車シェアリングサービスのデータに関する魅力的なCanvasダッシュボード

Aginic社は、オーストラリアの大手データ分析コンサルティングエージェンシーです。Aginic社はElasticのパートナーとして、両社共通のお客様が実用的な「変化のためのインサイト」を得られるように支援しており、健康、教育、エネルギー、エンターテインメント、防衛、金融セクターなどの主要なプロジェクトに、Aginic社のアナリスト、エンジニア、開発者、設計者、デリバリコーチが取り組んでいます。

最近開催されたElastic Brisbaneの会合において、Aginic社のチームはElastic Stackの新しい画期的なCanvasおよびSQL機能を紹介するために、オーストラリアのニューサウスウェールズ州における自転車シェアリングサービスの改善に役立つ可能性のある一連のダッシュボードについて仮説を立て、それに基づいて実際に作成することにしました。

チームはまずいくつかのオープンデータソースと過去のユースケースを掘り下げ、Kibanaの新しいアプリケーションであるCanvasをすばやく操作し、NYC CitiBike System1の既存の通勤シナリオデータを1つのエレガントなビジュアライゼーションに統合しました。そこから、ニューサウスウェールズ州の自転車のレンタル料、レンタル用自転車の在庫の監視、通勤者の全体的な満足度、自転車の全体的なユーザビリティの向上をサポートする方法を模索し始めました。 

その方法は以下のとおりです。

まず、CanvasダッシュボードでNYC CitiBike Systemのデータの一部を表しました。具体的には、トランザクションから得られた通勤データと、各時点での駅の状態のメトリックを活用できるようにデータセットを選択しました。この2つの異なるタイプのデータを使用することで、Canvasの新しい機能を最も的確に紹介できると考えたからです。

通勤データソースは、S3にホストされている履歴データを利用しました。プレゼンテーション時には、シンプルな一括Logstash CSVインポートパイプラインを使用しました。これにより、簡単に拡張して結果を自動的かつ定期的にダウンロードすることも可能になるため、Elasticsearchのデータを常に最新の状態に維持できるようになります。

一方、駅の状態に関するデータフィードは、頻繁に更新されるJSON URLで構成されています。そのURLには、各駅で利用可能な自転車の台数など、さまざまなメトリックが含まれています。このURLへのリクエストの結果は、次の形式の最上位のJSONオブジェクトです。

{"last_updated":1549188861,"ttl":10,"data":{"stations":[]}}

ここでのリアルタイムフィードの鍵となるのは、 last_updatedおよびttl (time to live)フィールドです。ttlフィールドは、このフィードが再びアップデートされるまでの残り時間を示しているため、last_updatedにttlフィールドを足すと、次にフィードがアップデートされる時間が分かります。データをできる限り最新の状態に維持できるように、フェッチ/スリープのループに留まるようカスタムのPythonアプリケーションを記述します。

これでデータはElasticsearch内にあるので、Kibanaに移動してビジュアライゼーションを試せるようになりました。元来、ダッシュボードには、ユースケースによっていくつかの目的があります。

  • 情報を効率的に伝える
  • ドリルダウンおよびフィルター機能によってセルフサービスで発見できるようにする 
  • 特定のビジネス部門のレポートの生成を自動化する

フィルターを使用したセルフサービスによるインタラクティブなディスカバリワークロードには、Kibanaに組み込まれたダッシュボード機能が最適です。ユーザーはすばやく簡単に、提示されたデータを操作できるからです。これまでは、非インタラクティブなユースケースのために、(たとえばd3をベースとした)カスタムアプリケーションを構築するというケースがよくありました。それらのカスタムアプリケーションは、開発時間の観点、および組み込みのダッシュボードが影響を受けないように継続的にサポートするという観点から投資が必要でした。

Canvasでは、従来のグリッドレイアウトのダッシュボードからオブジェクト中心のシームレスなレイアウトへと移行することで、この課題を解消します。そのような移行によって、自由形式でビジュアライゼーションのスタイルを作成することが可能になり、創造の自由がさらに高まります。しかしそれよりも重要なことは、デザイナーが各オブジェクト/グラフィックに関するさらなる制御性を得たことです。データビジュアライゼーションとデータの間のインタラクションをグラフィックオブジェクトで表現することで、これまでよりも意味がさらに一目瞭然になります。 

canvas-2.png

ただしここで注意が必要なのは、データプレゼンテーションツールは、オーディエンスを理解している場合にのみ役立つということです。つまり、意味(定義)と(簡単に理解できる形式になっている)データをペアリングする能力が鍵となります。この要件はCanvasの使いやすさによって軽減されます。ユーザーは、そのニーズを満たすため、およびそのビジュアライゼーションが全体として、見ている人に情報をすばやく伝えるための十分なコンテキストを提供しているかどうかをチェックするために、迅速にバージョンを繰り返すことができます。つまり、デザイン思考の可能性と、BIのコンテキストにおける迅速な繰り返し作業の可能性を真に実現することができるプラットフォームとなっています。

最初のCanvas Workpadは、単純にページの隅にロゴを付けるのではなく、ダッシュボード自体にブランディングを統合するという前提で構築されました。このアプローチにより、アニメーション化されたリアルタイムのインフォグラフィックを低い開発コストで作成するなど、特定の可能性が生まれます。 

canvas-1.png

このダッシュボードはCanvasのテクノロジーを示す以上のものではありませんが、システムの保守担当者にとっては概要ダッシュボードとなり、また自転車を利用する可能性のある人が自分の利用する駅に自転車があるかどうかを一目で把握できる一般向けの画面として機能します。どちらのシナリオでも、目を引くダッシュボードを使用することによって、それを見る人は主要なメトリックまたは興味のある情報をすばやく特定できます。

結局のところ、Canvasダッシュボードが私たちの仕事に役立つ用途は、きわめて多数あるということが分かります。このようなソリューションは、既存のユースケースにおけるダッシュボードの使いやすさを改善することができ、結果として、得られる情報やユーザーによるインタラクションを増やすことにつながります。Canvasは新しい製品ではありますが、従来のダッシュボード/BIソフトウェアで置き去りにされていたギャップを埋めます。私たちは、お客様のビジュアライゼーションに関する問題に対して、Canvasを使用して独自のソリューションを提示できるようこれからも取り組んでいきます。

1Aginic Pty Ltd社は、今回取り上げた自転車シェアリングサービスとは提携しておらず、同サービスからの承認、支持、後援も受けていません。


Ruben Slabbert
Ruben Slabbert氏は、Amazon Web Services (AWS)、Microsoft Azure、およびGoogle Cloudのエンタープライズデータパイプラインを専門とするクラウドデータエンジニアおよびアプリケーション開発者です。Aginic社での在職中には、主にパイプラインアーキテクチャの責任者として、複数の部門にまたがるチームを管理し、信頼できるバッチおよびリアルタイム処理を本番システムからクラウド内のデータレイクおよびウェアハウスに提供していました。

Andrew Li
Andrew Li氏は、データサイエンスおよび全文検索に関する広範な知識を備えた分析コンサルタントであり、分析を活用した成果の向上に熱心に取り組んでいます。 
機械(医用生体)工学の学士号を取得後にそのキャリアをスタートさせ、健康、政府、オーストラリア証券取引所における上位企業など、さまざまな業界の公的および民間セクターのクライアントのコンサルタントを担当しています。