Skip to main content

Amazon Athena

Overview

Amazon Athenaは、標準的なSQLを使用してS3のデータに対して直接クエリを実行できるサービス。
直接クエリが発行できるため、データをAthenaにロードしたりする必要はない。
また、S3以外のソースにデータがある場合は Athena Federated Query を使用してクエリを実行するか、複数のデータソースからデータを抽出してAmazonS3に保存するパイプラインを構築できる。
Athena Federated Query を使用すると、リレーショナル、非リレーショナル、オブジェクト、およびカスタムのデータソースに格納されているデータに対してSQLクエリを実行できる。
Athenaは、サーバーレスであるため、インフラストラクチャの設定や管理は不要であり、料金体系は、実行したクエリにのみ課金される。

Athenaでは、マネージド型のデータカタログを使用して、 S3上のデータベースとテーブルに関する情報やスキーマを保存する。
AWS Glueが利用可能なリージョンでは、アップグレードによりAmazon AthenaでAWS Glueデータカタログを使用できる。
AWS Glueが提供されていないリージョンでは、Athenaで内部カタログが使用される。
Athenaで使用可能なSQL言語は、HiveQLに基づいたデータ定義言語 (DDL) と、 Prestoに基づいたデータ操作言語 (DML) がサポートされている。(2022年7月時点)、クエリ結果は指定したS3上に自動的に保存され、Athenaのクエリエディター上でも確認できる。

Image from Gyazo