MySQL と Big Data

「ビッグデータ」は組織の業務革新の可能性を提供します。数年毎にビジネスデータ量は倍増を続けており、アナリストやビジネスユーザーは、複数ソースからのデータ統合や解析、および顧客、パートナー、ビジネスプロセスのデータ分析に大きな利点を見出しています。

世界でもっとも普及しているオープンソースデータベースの MySQL は、ウェブやクラウドにおいても広く普及しているデータベースです。多くのビッグデータ・プラットフォームの主要コンポーネントとなっています。Hadoop ベンダーによれば、展開されているビッグデータの80%は MySQL と統合されていると推定しています。

データ量とデータ種類の飛躍的な増加に伴い、データライフサイクルの各ステージで適したツールを活用し、完全なライフサイクルを作り上げることが重要です。


Tools to Integrate MySQL with Hadoop

MySQL と Hadoop を統合させるツール


  • 取得: NoSQL APL を通じて、ACID 特性の保証を犠牲にすることなく MySQL は大容量、高速のデータを取り込むことが可能なため、データ品質を確保できます。Hadoop にデータが取りこまれる前に、新たに収集されたデータをリアルタイムで解析することで、ビジネス的な分析を素早く実施できます。さらに、医療または金融サービスで保持されるデータなどの機密情報は、Hadoop へ転送される前にデータを匿名化させる処理も可能です。
  • 体系化: データは Apache Sqoop を利用したバッチ処理または MySQL Applier for Hadoop を利用したリアルタイム処理で、MySQL テーブルから Hadoop へ転送されます。新規データを MySQL から HDFS へ直接ストリーミングすることで「思考と同じ速さ」で解析が可能です。
  • 分析: 複数のソースから取りこまれたマルチ構造化データは Hadoop プラットフォーム内で統合され処理されます。
  • 意思決定: 分析結果は Apache Sqoop を通じて MySQL へロードすることで、 リアルタイム運用プロセスまたは BI ツールへ情報を提供します。

その他のリソース