ソフトバンクのシステム基盤本部は、ソフトバンクのサービスを支えるサーバーやスト レージ、ネットワークの開発・運用・監視を担い、利用部門に提供しています。ビジネスの 変化に迅速に対応するために、オープンソースのテクノロジーも積極的に活用しています。はじめは少数のメンバーがログ分析のためにはじめた Elastic Stack の利用ですが、次第に オフィスのあちこちで Kibana の Dashboard が目につくようになり、有効性が実証、認知さ れるようになりました。
歴史的に各システムは独自開発を繰り返してきたことから仕様の統一がされておらず、シ ステムの稼働環境を把握するのが困難な状況でした。システムの分析と監視そのものに対 する方針の見直しも進んだことから、本格的に Elastic Stack を利用したログ分析と IT リソー ス監視プロジェクトに着手しました。ソフトバンクのシステム基盤本部 システム基盤統括部 で統括部長を務める加藤靖之氏は、「これまで、このような非機能の取り組みは、後回しにさ れがちでしたが、システムの SLA を担保し、早期に問題解決を行うため、本格的に見直す必 要がありました。」と解説しています。
オープンソースのテクノロジーをフル活用するには、ベンダーと二人三脚でプロジェクトを進めることが必須であると考えました。Elastic のコンサルティングチームのサポートのもと検証を行い、Elastic Stack を利用したログ分析プラットフォームを設計しました。Elastic との関係は、ソフトウェアの使用とオンサイトでのコンサルティング、サブスクリプションを通じてのテクニカルサポートの利用にとどまらず、利用部門とのベストプラクティスのシェア、X-Pack 活用のための勉強会を定期的に実施しています。利用部門からのフィードバックはすべてシステム基盤本部に蓄積され、安定稼働に寄与するだけではなく、他部門への導入促進にも貢献しています。
ソリューションと効果 : 統一されたログ分析プラットフォーム ひとつのダッシュボードで俯瞰して監視が可能に
実際に、Elastic Stack は、どのように利用されているのでしょうか。システム基盤本部では、OS やミドルウェアから出力されるログやメトリックを可視化しています。また、OpenStack の仮想マシンの稼働状況も監視しています。
現在稼働しているサーバー数は数千に昇っています。 「数万台規模のサーバー を安定稼働するためには、運用監視の仕掛けを、自社で開発および運用できる仕組みが必要です。」と加藤氏は、説明しています。また、Elastic Stack の導入効果について「数台程度のサーバーであれば、個別に状況を把握できますが、数万台となると、そういうわけにはいきません。これまでの管理ツールに加え、Elastic Stack を使用することでサーバー群のリソースの使用状況を、リアルタイムにひとつのダッシュボードで俯瞰できるようになりました。」さらに、「 IT システム全体の稼働環境を把握することで、よりダイナミックに IT リソースを割り当てることができるようになりました。」と強調しています。
さらに効率的な IT システムの運用を実現する観点では、どのような展望を持っているのでしょうか。加藤氏は、「システム基盤本部では今後、Elastic Stack を活用し、事後の障害の解析はもちろんのこと、障害の予兆を察知し、事前に予防できるようにしたい考えです。またサーバーの柔軟な拡張・縮退運用やシステム全体のキャパシティプランニングに役立てたいです。」と抱負を述べています。
システム基盤本部では、数多くのオープンソーステクノロジーを採用しています。今後はどのような方針なのでしょうか。
加藤氏は、次のように語っています。「オープンソースについては、常に最新の動向を視野に入れながら導入検討するのが基本スタンスです。特定のエリアのスペシャリストであるオープンソースベンダーと密な関係を続けることは、ビジネスのスピードアップだけでなく、エンジニアのスキル向上にも大きな影響があります。」
システム基盤の開発現場でオープソースの導入に取り組み、システム基盤統括のシステム基盤開発課で課長代行を務める松浦 晋氏は、「将来は、単純なソフトウェアのユーザーにとどまらず、オープンソーステクノロジーに対して積極的なコントリビューションができるような文化をソフトバンクグループ全体に広げたい。」と述べています。