検索
メディア&エンターテインメント

日本経済新聞社、Elastic Cloudで2億件超の検索基盤を刷新。生成AI新サービスの基盤にも活用

検索基盤刷新によるコスト削減

日本経済新聞社のElasticsearchへの移行及びクラウド化でインフラコストを22.5%削減。2億ドキュメント超の膨大なデータの効率的な活用が可能に。

運用負荷軽減と耐障害性の向上

マネージドサービス「Elastic Cloud」を導入し、インフラ運用を大幅に省力化しながら、耐障害性を強化。少人数での大規模運用と高い可用性を実現した。

生成AIサービスの迅速な商用化

Elasticsearchの検索拡張生成(RAG)とベクトル検索を組み合わせ、生成AIサービス「NIKKEI KAI」をわずか1年足らずでリリースすることに成功。

導入企業アクロクエストテクノロジーについて

働きがいのある会社ランキング日本1位を3度受賞。全社員で給与まで決定するオープンな社風を特徴とするITベンチャー。 Elastic Stackの導入・設計・運用を一貫して支援し、日本経済新聞社様をはじめとする大規模検索システムにおいてElasticsearch導入の豊富な実績を有する。 日本初のElasticコンサルティングパートナーであり、Elastic認定資格者数は国内最多。

150年にわたって経済ニュースを蓄積してきた日本経済新聞社のデータベースサービスが急速な進化を遂げている。同社は従来の記事検索の枠を超え、検索した記事情報から生成AIが要点を抽出し、質問の答えを直接返すサービス「NIKKEI KAI」をリリースするなど、検索サービスに最先端のテクノロジーを積極的に導入しており、検索エンジン「Elasticsearch」はその心臓部を担っている。

記事データベースのクラウド化と検索基盤の刷新

日本経済新聞社のメディア業界における150年の歩みと、膨大な記事ストックを生かした「日経テレコン」「日経NEEDS」などの法人向けデータベース事業は、今日の同社の大きな収益柱だ。中でも「日経テレコン」は国内上場企業に70%以上が利用しており、いまやビジネスパーソンに不可欠なものとなっている。

かつて、同社の記事データベースはオンプレミスで運用されていた。同社技術戦略ユニット サービス基盤第一グループ 検索エンジニアの日當泰輔氏は当時の状況をこう語る。

「日経テレコンは、豊富な検索機能が特長です。例えば記事検索の結果を集計するアグリゲーションの機能や、検索したワードを記事中にハイライトする機能などをユーザーが細かく設定できるように作り込んでいました。当時のデータベースの運用は外部に委託していましたので、仕様変更のたびに仕様書を書き直し、開発を依頼するためのコストも時間もかかっていました」

加えて、データベースの拡張性にも課題を抱えていた。「当社のデータベースサービスは、外部の幅広いメディアを一括で検索できる点が強みです。そのため、常に新たなメディアとの提携を模索しており、実際に提携メディアが増えることはユーザーの増加につながっています。しかし、オンプレミスで運用しているため、提携先の拡大に合わせてサーバーの増強が必要となり、運用負荷は一方的に増えていました」(日當氏)

約200台ものサーバーを運用していた同社は、オンプレミスでのデータベース拡張に伴う手間とコストを抜本的に見直す時期に来ていた。そこで同社は2018年、データベースのクラウド移行と検索エンジンの刷新を決断。そして、データベースシステムの開発運用体制の完全内製化に踏み切った。

その際、新たな検索エンジンに求めた要件は厳しいものだった。「クラウド化にあたっては、日経テレコンの豊富な検索機能に全て対応できるエンジンが絶対条件です。それを満たしたのがElasticsearchでした」(日當氏)

同社における検索エンジンの変遷

同社における検索エンジンの変遷

クラウド移行によりインフラコスト削減とスケーラビリティを獲得

移行後の成果は顕著だった。検索エンジンをElasticsearchに移行したことにより、インフラコストを22.5%削減。また、もう1つの課題であった「運用の内製化」も実現した。「新聞社である当社は、在籍するエンジニアが少ないのですが、Elasticsearchはイメージが配布されていて仮想化しやすく、少人数でも自らスケールさせながら大規模なシステムを運用できる点が大きなメリットでした」と日當氏は語る。

そのほか、耐障害性や拡張性の高さも評価されている。万一、特定のノードがダウンしてしまった場合も、あらかじめ用意してあるレプリカからの自動復元が可能となっている。また、オンプレミス時代には困難だったバージョンアップも内製で完結。常に最新機能を取り込める体制が整った。

データベースと検索基盤のクラウド化により、増え続けるデータ量への対応もスムーズになった。処理するデータ量は、約2.1億ドキュメントに達しており、1876年に日本経済新聞の前身として創刊した週刊紙「中外物価新報」の紙面PDFから、現在に至るまでの全ての記事データが検索の対象となっている。

日當氏と同じサービス基盤第一グループの溝口泰史氏は、「提携メディアが追加されても、ノードを追加してインデックスを設定すれば、性能を落とすことなく検索対象を拡張できます。このスケーラビリティの高さは、当社のデータベース検索には不可欠な要素です」と語る。

Elasticsearchによる検索基盤の構成と規模

Elasticsearchによる検索基盤の構成と規模

Elastic Cloudへの移行でさらに運用の効率化を実現

クラウド基盤への移行によって順調に成長してきた同社のデータベース事業だが、アマゾン・ウェブサービス(AWS)上のインフラ管理負担を軽減させるために、同社は2024年にElasticsearchのマネージドサービスである「Elastic Cloud」を導入する。

「以前は原因不明の障害が発生した際に、原因の断定に時間を要していましたが、今はElastic側が窓口となり対応してくれます。この負担軽減は大きいと思います」と溝口氏は評価する。

また、日當氏、溝口氏のチームは、少人数でサービスの持続可能性を確保したことが評価され、社内表彰を受けるに至った。「データベース事業は生成AIの登場でビジネスモデルを大きく変えようとしています。その心臓部である検索エンジンをElastic Cloudに変えたことで、次世代への準備が整ったと考えています」と日當氏は語る。

マネージドサービスであるElastic Cloudを採用したことで、インフラを管理する手間が不要になり、サービスの開発に専念できるようになりました。

– 株式会社日本経済新聞社 技術戦略ユニット サービス基盤第一グループ 溝口泰史氏

RAGとベクトル検索の組み合わせで新しい顧客価値を生み出す

同社が「次世代」と呼ぶ検索モデルを取り入れた新しいサービスが「NIKKEI KAI」だ。従来の「ユーザーが検索して記事を探す」サービスから、「AIが記事の検索結果を基にユーザーの質問に答える」という全く新しい体験と価値をもたらす。日當氏は、「検索結果のドキュメントを返すだけのサービスから、ユーザーが欲しい情報を抜き出して返す、いわゆるゼロクリック化への大きな転換です」と、NIKKEI KAIの意義を説明する。

技術面では、Elasticsearchを用いたRAGを実装。ベクトル検索と全文検索を組み合わせた「ハイブリッド検索」を採用している。溝口氏は、「質問が入力されると、内部ではその内容を分解してさまざまな観点で検索クエリを実行。その結果を集約して生成AIに渡すという複雑なロジックが動いています」と語る。

特筆すべきはその開発スピードだ。NIKKEI KAIの開発は2024年初頭に始動し、8月にはデータベースの構造が固まってβ版が稼働。データ処理バッチの運用や検証を経て、2025年3月には本番環境でサービスを開始した。

内製で1年かからずに新サービスの商用化に至った理由について日當氏は、「すでにElasticsearchによる検索基盤が実装されていたことだけでなく、Elastic Cloudによる運用体制が確立されていたことも大きな要因でした」と話す。

加えて、Elasticのサポートについても高く評価している。「NIKKEI KAIの構想時点から、RAGによるシステムを構築するにあたり、どのようなクエリを書いたらいいか、パフォーマンスはどうなるかなどを質問して、アドバイスをもらっていました。上位ライセンスの導入を見据えた機能検証の際、新機能で実現できそうな構成について質問し、的確なアドバイスをもらいました。また、ElasticsearchにはRAGに対応する最新機能が取り込まれていたことも、他社に先駆けたサービスを構築できた理由だと思います」

溝口氏も、Elasticの開発や運用に対するサポートに助けられたと語る。「チャットツールなどでこちらが抽象度の高い質問をしても、的確に意図をくみ取った答えをもらうことができました。」

最新技術の導入で、キーワード検索を超える体験を目指す

今後は、1本の記事を「チャンク」と呼ばれる複数のブロックに分割してインデックスを作成しておくことで、検索結果の精度とスピードを向上させるほか、データ表現の新しい形である「スパースベクトルモデル」の導入を検討している。

「現在当社が検索に採用しているベクトルデータは非常に重いため、2億ドキュメントの全てに付与することは、コスト的にも現実的ではありません。しかし、『ELSER』などのスパースベクトルモデルを採用すれば、情報を大幅に圧縮できるため、全データに対して、キーワード検索を超えた直感的な検索体験を提供できると期待しています」(日當氏)

日本経済新聞社の検索基盤は、Elasticの最新テクノロジーを取り込みながら、記事情報の価値を最大化する次なるステージへと着実に歩みを進めている。

今後は新しいベクトル検索の技術を導入することで、既存のデータベースサービスも進化させることができると期待しています。

– 株式会社日本経済新聞社 技術戦略ユニット サービス基盤第一グループ 検索エンジニア 日當泰輔氏