AWSのQuickSightについてまとめています。
AWSのQuickSightは、機械学習アシストの予測ができるBIツール
AWSのQuickSightは、AWSのBIツールで、複雑なデータをグラフによる可視化が可能。機械学習アシストによる異常検知や予測、数値データをわかりやすい言葉で要約する機能があり、社内BI専門家やデータアナリストがいなくても可視化したデータをビジネスに役立てることができます。
QuickSightで実現できることは、こちらのマンガ仕立ての解説がわかりやすいです。
関連)AWSマンガ 第8話「全てのデータを可視化しろ!」(1/8) | AWS
AWSのQuickSightの特徴は以下の通りです。
- 機械学習アシストよる予測や異常検知と、短い文章による言語化
- コストは上限付きの従量課金制
- インタラクティブなグラフをイントラネットなどポータルに埋め込み可能
上記の特徴の前にまず、AWS QuickSightの基本機能として、データをグラフ化して「見える化」できるまでが早いという点があります。
AWS QuickSightは多彩なデータ形式に対応していて、クラウドやオンプレミスのデータソースに直接接続してデータのインポートが可能。例えば、 Salesforce、Square、ServiceNow、Twitter、Github、JIRA などの SaaS アプリケーション、Teradata、MySQL、Postgre、SQL Server などのデータベース、Redshift、Athena、S3、RDS、Aurora などの AWS のサービス、プライベート VPC サブネットに対応。Excel、CSV、JSON、Prestoなどのファイルをアップロードしてデータ取り込みすることも可能です。
【関連記事】
▶AWSのデータベースサービス「Amazon RDS」とは?
対応しているデータベース形式は以下の通りです。
- Amazon Athena
- Amazon Aurora
- Amazon OpenSearch Service 7.7 以降
- Amazon Redshift
- Amazon Redshift Spectrum
- Amazon S3
- Amazon S3 Analytics
- Apache Spark 2.0 以降
- AWS IoT Analytics
- Exasol 7.1.2 以降
- MariaDB 10.0以降
- Microsoft SQL Server 2012 以降
- MySQL 5.1 以降
- Oracle 12c 以降
- PostgreSQL 9.3.1 以降
- Presto 0.167 以降
- Snowflake
- Teradata 14.0 以降
- Timestream
一部のデータベースにはバージョンによる縛りがあり、古いバージョンのデータベースはテキストファイル形式でエクスポートするなどの処置が必要なケースがあります。QuickSightへのアップロードに対応しているテキストファイルの形式は以下の通り。
- CSV 、TSV(カンマまたはタブ区切りのテキスト形式のデータ)
- ELF、CLF(ログフォーマットファイル)
- JSON ファイル
- XLSX(マイクロソフトのExcel形式ファイル)
QuickSightの自動グラフ化により、与えられたデータを最適な形に見える化します。グラフ形式はユーザが変更、カスタマイズすることが可能です。
- 棒グラフ(水平と垂直)
- 箱ひげ図
- コンボチャート
- ドーナツチャート
- 塗りつぶされたマップ
- ファンネルチャート
- ゲージチャート
- 地理空間チャート(マップ)
- ヒートマップ
- ヒストグラムチャート。
- 主要業績評価指標(KPI)
- 折れ線グラフ
- 円グラフ
- ピボットテーブル
- 散布図
- テーブル
- ツリーマップ
- ウォーターフォールチャート
- ワードクラウド
QuickSightの特徴1:機械学習アシストよる予測や異常検知と、短い文章による言語化
データをグラフ化できても、そのデータが何を表しているのかを読み取って次のアクションに活かせなければ意味がありません。一般のBIツールでは、BIエキスパートやデータアナリストが、経営層や管理職向けにデータに人間の解釈を加えた「分析レポート」のようなものを作成していました。
QuickSightでは、BIツールの専門知識や経験がなくても、機械学習アシストによる予測や異常検知が可能。例えば、現在までの売上発生ペースで年間ノルマの達成が可能かどうかを未来日付でグラフ化して予測します。さらに自動ナラティブ機能により、予測や異常検知の結果を短い文章で「分析レポート」のように生成します。
QuickSightの特徴2:コストは上限付きの従量課金制
BIツールのよくある問題点として、ユーザによって使用頻度が大きく異るという点。一般的なBIツールでは、少しでもツールを使うなら「1アカウント分」としてカウントされ、課金対象になります。しかし、QuickSightは従量課金制で使えます。そのため、「よく利用するヘビーユーザー」「たまに使うライトユーザー」「まったく使わないユーザー」が居たとすると、全く使わないユーザーは0円、ライトユーザは使った分だけの従量制課金、一定以上利用するヘビーユーザーは固定料金となります。
例えば、「来月、2アカウント分、少しだけ利用したい。その後は使わない」という要求にも、柔軟に対応できます。無料トライアルが可能なため、試験的な導入も容易です。
【関連記事】
▶AWSの無料利用枠は、各サービスを条件付きで無料使用できる 3タイプの無料枠あり
QuickSightの特徴3:インタラクティブなグラフをイントラネットなどポータルに埋め込み可能
一般的なBIツールでは、BIツールの操作に習熟する必要があり、「一部の人しか使えない高級なオモチャ」になりがち。一般ユーザに使わせたくても、日々の業務で手一杯のユーザにはBIツールの研修などを受けさせる余裕がなく、BIツールを全社的に導入したけどあまり使われていない、というケースもあります。
AWS QuickSightでは、イントラネットなどにグラフやテーブルなどデータを可視化した状態で埋め込みができ、簡単なクリックやドラッグ操作でドリルダウンやフィルターなどのインタラクティブ機能が提供されます。スケジューリングしてEメールレポートとしてユーザに自動送付することで、重要な分析レポートを見逃さないようにできます。
QuickSightのカスタマイズ
QuickSightの機能だけでは物足りない場合、コマンドラインインタフェースやSDKを使ってQuickSightのカスタマイズが可能です。以下のSDKが用意されています。
- AWSコマンドラインインターフェース
- AWS SDK for .NET
- AWS SDK for C ++
- AWS SDK for Go
- AWS SDK for Java
- AWS SDK for JavaScript
- AWS SDK for PHP
- AWS SDK for Python(Boto3)
- AWS SDK for Ruby
AWSコマンドラインインタフェースでは、コマンドラインでQuickSightが構築・操作できるためデフォルト機能ではできない自動化処理を、バッチ処理を記述する感覚で自動化できます。SDKを使えば、さらに高度な処理が可能です。
以下は、Python用のSDKを使って分析一覧を取得する例です。
response = client.list_analyses( AwsAccountId='string', NextToken='string', MaxResults=123 )
応答として、以下のようにJSON形式のレスポンスが返ってくるので、応答処理を作成してカスタマイズを行なうことができます。
{ 'AnalysisSummaryList': [ { 'Arn': 'string', 'AnalysisId': 'string', 'Name': 'string', 'Status': 'CREATION_IN_PROGRESS'|'CREATION_SUCCESSFUL'|'CREATION_FAILED'|'UPDATE_IN_PROGRESS'|'UPDATE_SUCCESSFUL'|'UPDATE_FAILED'|'DELETED', 'CreatedTime': datetime(2015, 1, 1), 'LastUpdatedTime': datetime(2015, 1, 1) }, ], 'NextToken': 'string', 'Status': 123, 'RequestId': 'string' }
AWSのQuickSightのまとめ
- AWSのQuickSightは、機械学習アシストで予測・異常検知ができるBIツール
- QuickSightの料金体系は上限付きの従量課金制で、ユーザの使用頻度に最適な料金が適用できる
- BIツールの研修なしでも、イントラネットなどにクリック操作できるグラフを埋め込み、感覚的に社員に使ってもらうことが可能