課題
ソリューション
Elasticsearchで分析ソリューションを構築し、毎日4千万件 のドキュメントを処理して組織全体のサイトトラフィック をリアルタイムで可視化することで、こうした課題を解決。
Case Study Highlights
リアルタイム分析の活用
- 3億6千万件ドキュメントへのクエリもストレスなく 動作
- すべてのコンテンツのトラフィックをリアルタイムに 表示
- どのような更新内容がサイトトラフィックに影響をも たらすのか洞察を深める
組織に活力をもたらす
- 読者がどのような動向をしているか組織全体にリアル タイムに洞察与える
- 500人を超えるユーザーが分析結果へのアクセス、情報を共有
- 全従業員に探求心とイノベーションの文化を植えつける
常に変わりゆくニュースのサイクルに乗り遅れない
1821年に英国の新聞会社として設立されたガーディアンは、現 在世界的なニュースコンテンツの配信元となっています。同社の サイト(theguardian.com)は、1日に500万人ものユニークビジ ターが訪れる世界で最も人気のあるウェブサイトの1つであり、 英語で記述された新聞ウェブサイトとしては世界第3位です。
ガーディアンが社内開発したOphanは、編集者、記者、検索最適 化チーム、開発者などの全社的なユーザーに、購読者がどんなコ ンテンツにどのような反応を示しているかをリアルタイムかつ 具体的に表示できる分析システムです。分刻みで変化するニュー スの世界では、リアルタイムの可視性は何にも代えがたい価値 があります。ガーディアンでは、Ophanが生成するデータを活用 して、コンテンツが適切なタイミングで、正しいソーシャルメデ ィアプラットフォームに、ふさわしい見出しとして表示されるよ うに鋭意努力しています。
編集プロセスの一環として、トラフィックを呼び込むコン テンツとそうでないコンテンツを知ることは非常に重要で す。」
Elasticsearchで1日4千万件のドキュメントを処理
「OphanがElasticsearchで開発される前までは、ガーディアン では、4時間遅れで結果が表示される従来型の分析パッケージ を使用していました。」とガーディアンのアーキテクチャ部門デ ィレクターのGraham Tackleyは当時を振り返ります。「そこか らデータを取り出すのも一苦労でした。ひどく時間が掛かったの です。そのため、自分たちが実施した効果を測定したり、何か手 がかりを得るということはできませんでした。まさに、暗中模索 だったと言えます。」
ガーディアンはElasticsearchにより、市販の汎用分析ソリュー ションに頼らず、非常に強力な分析システムを社内開発すること に成功しました。Elasticsearchにより、1日4千万件のドキュメ ントを処理し、リアルタイムに洞察を得ることができるOphan は、全社内で500人を超えるアクティブユーザーが使用している 分析ツールへと成長しています。ガーディアンの業務の大部分 で、コンテンツがどのように消費されているかを把握するために Elasticsearchを使用しています。
ガーディアンにおけるElasticsearchのユースケースは多岐に 渡ります。分析システムで得られる可視性として、各コンテンツ 項目のヒット数、どのような見出しやコンテンツがより多くのト ラフィックを生むか、トラフィックはどこから参照されてるの か 、い つ ・ ど の ソ ー シ ャ ル メ デ ィ ア プ ラ ッ ト フ ォ ー ム を 使 え ば 特 定のコンテンツのプロモーションでインプレッションを最大化 できるのか、読者はどのリンクをクリックして次のコンテンツに 進 む の か 、な ど を 確 認 す る た め に 使 用 さ れ ま す 。エ ン ジ ニ ア が Elasticsearchを使用してイベントを検索し、ウェブサイトのパ フォーマンスの問題を診断することもあります。
「Elasticsearchによって、チームはコンテンツやヘッドライン の 修 正 、コ ン テ ン ツ プ ロ モ ー シ ョ ン に 注 力 で き る よ う に な り ま し た 。大 切 な の は 、ユ ー ザ ー が 素 晴 ら し い 体 験 を す る こ と 、そ してユーザーが次に興味を惹かれると思われるものを提供す る こ と で す 。ク リ ッ ク 数 が 増 え る の で 私 た ち に と っ て 良 い 効 果 があると実感できますし、読者にとっても興味深いコンテンツ が見つかるという点で非常に大きな効果を実感しています。」 (Tackley)

リアルタイムに対応する
「我々はニュース企業です。つまり、ニュースのアジェンダに柔 軟に対応する必要があります。ガーディアンのトラフィックの大 部分は非常に短い時間に集中して発生します。そのような状況 下では、トラフィックのピークに対応することが求められるため、情報を瞬時に入手することが必要なのです。起こっている出 来事を把握するのに日が暮れるまで待っているようでは遅すぎ るのです」(Tackley)
Elasticsearchは、ガーディアンが適切なコンテンツを正しいタ イミングで、それにふさわしいソーシャルメディアに対してプロ モーションするための可視性をリアルタイムに提供しています。
「Elasticsearchは、ソーシャルメディアがガーディアンのトラフ ィックに及ぼす影響を分析し、それによりソーシャルメディアプ ラットフォームをさらに活用しやすくすることに大きく貢献して くれました。」(Tackley)
編集プロセスの一環として、トラフィックを呼び込むコン テンツとそうでないコンテンツを知ることは非常に重要で す。
多くのユーザが分析結果を共有する
分刻みで行われるリアルタイムの改善に加え、ガーディアンでは サイト全体の改善も進めています。これは、読者の期待に応える ためにコンテンツや見出しを微調整するすべをみながそれぞれ 学習しているからです。
「編集プロセスの一環として、トラフィックを呼び込むコン テンツとそうでないコンテンツを知ることは非常に重要で す。Elasticsearchを使用して達成した成果の中で特に大きいの が、記者がコンテンツの読者を調査できるようになったことで す。多くの人がデータにアクセスできるようにしているので、編 集者や記者は自ら学習し、改善策を追求することができるよう になりました。Elasticsearchが自ら読者の動向を調査するとい う文化を促しているという事実は、非常にエキサイティングなこ とです。」(Tackley)
「組織内の対応に変化が見られました。2年ほど前までは、トラ フィックデータを見ることが許されていたのは経営陣のみでし た。他の人たちには、トラフィックデータを見ることは出来ず、も し見たとしたならば自分たちがタブロイド紙と化してしまうので はないかという恐怖がありました。現在では、組織のメンバー全 員が、現在コンテンツで何が起きているのかを把握出来ること が業務に役立つことを理解しています。」(Tackley)
「Elasticsearchのスケーラビリティにはこれまで驚かされるば かりです。導入した新機能によってElasticsearchに予想以上の 負荷がかかる場合、Elasticsearchクラスタの処理能力を追加し ます。この追加がすべてがうまくいっています。イノベーションの 速度を保つ上で、迅速にスケールアップできる能力は我々にとっ て不可欠です。」
生産性を無駄にしないスケーラビリティ
「Elasticsearchのスケーラビリティにはこれまで驚かされるば かりです。導入した新機能によってElasticsearchに予想以上の 負荷がかかる場合、Elasticsearchクラスタの処理能力を追加し ます。この追加がすべてがうまくいっています。イノベーションの 速度を保つ上で、迅速にスケールアップできる能力は我々にとっ て不可欠です。」(Tackley)
「比較的複雑なファセット形成を行う上で、最適化負荷が そ れ ほ ど 高 く な い と い う 点 は 、大 き な メ リ ッ ト で す 。ガ ー デ ィ アンでは、最適化に膨大な時間をかけることなく、3億6千 万件のドキュメントにクエリを投げることができます。そし て、Elasticsearchを使うことで、小規模な開発チームでも最適 化 に 膨 大 な 時 間 を 掛 け る こ と な く 、こ う し た シ ス テ ム を 実 現 で きている事実があります。Elasticsearchがなければ、時間的な 制約から、いまある多くの機能は実装できなかったでしょう。」 (Phil Wills, The Guardianシニアソフトウェアアーキテクト)