DX時代のデータ保護と利活用セミナー:断片化データを ”使えるもの”に再定義

DX時代のデータ保護と利活用セミナー:断片化データを ”使えるもの”に再定義

製造・流通・サービス

本記事は、2020年1月23日に開催したDX時代のデータ保護と利活用セミナーの講演内容をもとに執筆しています。

複雑化・断片化しているデータを一元管理する方法
企業データの多くは、様々なストレージ機器やパブリッククラウドに分散されており、いわゆる”塩漬け”になっているものから、BCP対策としてバックアップデータを保存するためだけのものなど使われ方も様々です。
全データの80%はファイル共有やオブジェクトの保存、バックアップやアーカイブ、テスト/開発、それらの複製など”断片化”しているとの調査結果もあります。
このような状態を放置すると、データ管理コストが増大するだけでなく、データを活用し、データの価値を引きだせないことによる機会損失など、深刻な問題に発展しかねません。
そこで、ITチームでのデータ管理の負荷を減らすだけでなく、それらの断片化データをビジネスにとって”使えるもの”に再定義するのが「Cohesity」です。

Cohesityは他のストレージソリューションとどこが違うのか?その特徴をおさらいしましょう。

Cohesity会社概要
Cohesityは2013年にNutanixの共同設立者でGoogle File Systemのリードエンジニアであるモヒット・アーロン氏によって創業された企業で、「Cohesity DataPlatform ™」ソフトウェアをはじめとするデータインラストラクチャテクノロジーを提供します。創業時から世界中の投資会社やITメーカーが経営陣に加わるなど市場からの期待も高く、米国を中心に1,300社以上がCohesityを導入しています。2019年には日本法人が設立され、アルファテック・ソリューションズは同年にCohesityの販売パートナーとなっています。

ここだけは抑えたいCohesityの特徴
Cohesityのソリューションには「スケールアウト型アーキテクチャ」と「マルチプロトコル / マルチアクセス」という大きな特徴があります。この2つを同時に・高パフォーマンスで実現することはテクノロジー的にとても難易度が高く、Cohesityが多くの企業から評価されるポイントになります。

1:スケールアウト型アーキテクチャ
Cohesityは、独自の分散ファイルシステム SpanFS® によって高可用システムを実現します。HCIのアーキテクチャを採用しているので、ハードウェアノードを追加することで、ほとんど自動的かつ仕様上は無制限に拡張でき、クラスタ内のデータ全体に重複排除を適用させることができます。
現在の企業ITでは、データベースサーバーやテスト環境など、多くのサービスがVM(仮想マシン)環境上で稼働しています。そして仮想化のモビリティ性と等しく手軽にバックアップができるため、バックアップ対象のマシン数もファイルの量もバージョンも増え、さらにデータベースなど容量の大きなVM(モンスターVM)も出てくるなど、バックアップ業務の管理が複雑になってきています。データ増加のペースの予測が難しい状況において、拡張性の高いバックアップアプライアンスとしてCohesityに関心をもたれる企業が多いとのことです。

2:マルチプロトコル / マルチアクセス
Cohesity DataPlatformは標準でNFS、SBM、Amazon S3などの主要なストレージアクセスプロトコルに対応しておりファイル・ブロック・オブジェクトのストレージアクセスをサポートします。同じデータにマルチプロトコルでアクセスできることで、Windows、Linux、S3 APIなど、主要な企業OSで稼働するアプリケーションをサポートが可能になります。また、システム毎にファイルとオブジェクトの専用ストレージを使い分けている場合、Cohesityの単一プラットフォームに統合することが可能になります。


バックアップ高速だけじゃない、DXを支援するCohesityの機能
Cohesityはしばしば「セカンダリーストレージ」「セカンダリーデータ」とう用語を使いますが、SLAを厳格に守る必要のある「プライマリストレージ」以外のデータ環境(バックアップ、一般的なファイルストレージ(NAS)、テスト・開発、分析)などは、すべてを統合管理し、有効活用してゆくビジョンを掲げているためです。
セッションの後半では、データの統合管理・活用を支援する機能をいくつか紹介いただきました。

その他の機能
1. Oracleテスト環境を迅速に提供する「マスキング機能」
2. 将来のIoTビジネスにも耐えられるファイルサーバとしてのスペック
3. ファイル監査(Spotlight)
4. セキュリティ(ウィルスソフトウェアとの連携)
5. 分析機能(Insight: 全文検索 / Splunk: ログ解析)


オラクルDBのバックアップからテスト環境を展開
セミナーでは、例としてオラクルDBのバックアップについてご紹介しました。
オラクルの本番環境のバックアップデータを「マスク処理」によってクレジットカード番号のような機密データをダミーの値に置き換えてクローンを作成し、テスト環境に展開する機能です。日々のスナップショットの更新もクローンに適用可能なため、開発者は最新のテスト・開発環境を利用し、品質向上にいちはやく着手することが可能になります。マスキング機能は2020年前半にリリース予定とのことです。

IoTに対応したファイルサービス
Cohesityはファイルサーバとしても優れた機能を有します。データ増加の背景としてIoT機器の増加、動画や音声、センサーなど様々な種類のデータも増えてきます。どんなデータがどれくらいのスピードで増えるか見通しがたてにくい中、Cohesityは今後IoTで増大するファイルサイズやファイル数にも対応できるファイルシステムを提供します。

Cohesityの機能 ※講演資料より一部引用

項目 他社製品 Cohesity製品仕様
完全に読み込まれた論理ファイルサイズ 4TB 無制限
(テスト結果:82TB)
スナップショット数 2万 無制限
(テスト結果:100万)


ファイル監査機能(Spotlight)
Spotlightはファイルサーバのバックアップとスナップショット管理に加えて、誰がいつファイルにアクセスして変更・削除したのかを把握することができます。
重要なデータなどの監査にも役立てることができます。

ウィルスソフトウェアサービスとの連携
主要なアンチウィルスサービスと連携し、Cohesity上のファイルサービスを健全に保ちます。

全文検索(Insight)
Cohesityはファイル共有内の全文検索だけでなく、バックアップデータ(仮想サーバーやファイルサーバ)の全文検索・検閲も可能になります。Cohesity創業者はGoogle File Systemの開発責任者ですので、ストレスなく検索できるでしょう。

Splunkを使ってCohesity上のデータを直接解析
セミナーで紹介したSplunkもCohesity上のコンテナ(Kubernetes)で動作します。

まとめ
多くの企業では、バックアップやDR対策として高額なストレージを2つのデータセンターに配置し、ストレージの機能を利用してミラーリングを行う方式や、システムやサービスごとにバックアップを行うなど、統一化が進まず管理も活用も非効率な場合が多いと言われています。
セカンダリーデータを単一のプラットフォームにまとめることで、容量効率を上げ、個々の運用に伴う運用負荷やリスクを低減することも可能になります。そして、Cohesityのビジョンやその提供機能はバックアップにとどまらず、企業の情報資産を守り・新たなビジネスに活かすうえでIT管理者だけでなく、セキュリティ部門や事業部門にわたって幅広く活用の可能性があります。
Cohesityを使ってデータ環境をまったく新しいものとして統合管理してみませんか?アルファテック・ソリューションズでは検証や導入のサポートサービスも提供していますので、お気軽にお問合せください。

Cohesityのセミナー資料をダウンロード

当記事は、2020年1月23日に開催した「DX時代のデータ保護と利活用セミナー」の内容を元に作成しています。記事の中には各社の見解などが含まれる場合があります。記載の社名・製品名は各社の商標または登録商標です。