原文を参照したい場合はこちら。
もしも数テラバイトクラスのデータを保存せねばならず、その要件が3桁から4桁も大きくなっていくようなアーキテクチャを利用する際に、どんなことがおこるか考えてみたことはありますか?データサイエンティストの力を借りなくても、こんな状況において、どこがかおかしくなってしまうということは明らかです。レガシーなインフラストラクチャ上で急速に膨れ上がる非構造化データは、まさにこうした問題を引き起こしています。非構造化ストレージを見直すべきタイミングが来ており、大規模と自動化された運用を備えた新たな現実的なアーキテクチャを考えなければなりません。
アナリストファームのESGが発行した非構造化データの夜明けという最近のレポートでは、如何にレガシーアーキテクチャがレガシーなファイルもしくはオブジェクトシステム上に保存された重要なデータの効果的な管理、保存、アクセスの提供をうまくできていないかということを述べています。彼らはモダンな非構造化ストレージソリューションは管理者がこのデータの大洪水を管理するのを手助けするだけでなく、ビジネスを成功へ導くためにユーザーが必要なデータにアクセスする優れた方法も提供できなければならないとしています。
主な問題はレガシーアキテクチャ上の非構造化データのサイロが急速に大きくなっていることです。ファイルもしくはオブジェクトシステム上に保存されている非構造化データはより多くのユーザー、エンドポイントとなるマシンが増え続け、より多くのプライマリ、そしてコピーデータを生成することで、2年ごとに倍増しています。これはゴミデータではありません。ときにはビジネスの成功に重要なものなのです。
非構造化データはオーディオやビデオそしてソーシャルメディアへの投稿などを含み、大抵の場合、簡単に検索ができるようなものではありません。それぞれ内部構造自体は持っていますが、事前に定義されたデータモデルで構造化されているものではなく、おそらくはテキストもしくは非テキスト、更には人が作成したか、機械が生成したというものです。そして殆どの場合はファイルもしくはオブジェクトストレージに保存されています。
継続的な、信頼性のあるストレージ上のデータへのアクセスを最適なパフォーマンス状態で提供することもまた、ITチームの責務です。データに伴ってストレージの利用が増え、ITチームとビジネス部門が大き制限を感じることになります。
- レガシーツールを利用しての対応ができないほどに管理の複雑性が増す。
- 古いトラブルシューティングツールの遅い診断プロセスによって解決までの時間が長期化する。
- システムのソフトウェアのアップグレードやハードウェアの交換にかかるメンテナンス時間が長期化し、停止を伴う更新やパーツの交換の手順がさらに頻繁になり、影響度が上がってダウンタイムが増える。もちろん、ITチームは継続してこの成長を管理しようとしていますが、増えることのない予算と従業員の増員を制限されています。
ITリーダーはデジタル・トランスフォーメーションプロジェクトを優れたデータアクセスの提供と同時にそのメンテナンスの負荷を下げるきっかけだと考えています。ESGによると調査に応じた回答者のうち86%がこうしたデジタルトランスフォーメーションを実施できなければ競争力を失うことになると述べています。
ESGはモダンなビジネスの必要とする大規模なデータ成長に対応し、デジタルトランスフォーメーションの試みをサポートする「データにフォーカスした非構造化データ」システムの3つの重要な要素を上げています。
まず、ソリューションはシンプルでなければならないということです。管理者の管理のためのオーバーヘッドを低減し、より価値のある活動を行えるように開放します。このソリューションは学習のための負担が小さいもので、より広い範囲のユーザーがセルフサービスで自身のデータに必要に応じてアクセスできるべきです。さらに標準化された手順を自動化し、セルフサービスでの展開が適切な利用ポリシーを違反しないようになっているべきです。さらにはAPIと全般に渡るプログラマブルな管理を提供し、開発者やアプリケーションが直接ストレージリソースを特定、管理できなくてはなりません。
続いて、ソリューションは柔軟性を備えたものでなくてはなりません。パブリッククラウドが人気を集める理由はそれが柔軟であるからです。モダンなソリューションは同様の柔軟性を備えているべきであり、管理者はプラットフォームとハードウェアの選択の自由が許されるべき ー ロックインなし ーです。管理者は自身が利用するだけの支払いでクラウドのような利用モデルが実現されるべきです、これによって管理者はリソースの計画の不確実さに対応する必要がなくなります。サイロをなくし、ファイル、オブジェクトそしてブロックストレージを同一のプラットフォームで稼働させることもできるべきで、同様にオンプレミスからパブリッククラウドへも拡張ができる様になっているべきです。さらにはオンデマンドでの拡張をサポートし、停止を最小限にとどめてワークロードとデータの増加をサポートしているべきです。
最後に、ソリューションはインテリジェントにルーチンの管理タスクを自動化する一方でデータについてのコントロールは維持できなくてはなりません。自動化された自己治癒と自己チューニングの能力を提供し、メンテナンスの業務ための時間を減らし、ダウンタイムもまた減らす事ができるべきです。保存されているデータについての知見も提供することができるべきであり、それによってデータの配置の判断はより正確なものになります。機械学習ベースの自動化されたコンプライアンスと統制によって、望まれないアクセスや利用からデータがセキュアで、保護された状態であることを保証することも必要です。
「インテリジェント」なクラウドライクなアーキテクチャとは、多くの意味で理想的なモデルです。あらゆる人にとって充分にシンプルで誰もがデータサービスをリクエストしてアクセスできる、それを支えるハードウェアを包み隠しながら、最適なデータ配置を提供できるほどに柔軟性を備え、あらゆるユーザーが確信を持って所有・管理が行えるだけの充分な自動化を備える。しかしながら、多くのワークロードにとってパブリッククラウドは最適なソリューションではありません。大規模になればなるほど経済性についても意味を成すことがまれになってきます。パフォーマンスについてもデータに遠隔地からアクセスしようとした場合には不足が懸念されます。こうしたワークロードにとって、これらの特徴を備えたオンプレミスのソリューションこそがベストな選択肢であり、モダンなデータにフォーカスした非構造化ストレージを構成しようというITチームにとって最適です。
エンタープライズのデータセンタを妨害し続ける級数的な非構造化データの成長の管理に立ち向かいながら、ストレージチームはソリューションを探しています。ソリューションやその他についてより詳しく知りたいという場合には、ESGのレポートと非構造化ストレージ・ソリューションについての分析を確認してみてください。更にnutanix.com/storageでより多くの情報をご提供しています。
2019 Nutanix, Inc. All rights reserved. Nutanix, the Nutanix logo and the other Nutanix products and features mentioned herein are registered trademarks or trademarks of Nutanix, Inc. in the United States and other countries. All other brand names mentioned herein are for identification purposes only and may be the trademarks of their respective holder(s).