このように AWSフォーラムスレッド 、AWS Glueを使用して、パーティションに異なるスキーマ(この場合はテーブルスキーマの異なる列のサブセット)が含まれるAWS Athenaテーブルを作成する方法を知っていますか?
現時点では、このデータに対してクローラーを実行し、Athenaでクエリを実行すると、エラー'Hive_PARTITION_SCHEMA_MISMATCH'
私のユースケースは:
スキーマを手動で記述する場合、テーブルスキーマは1つしかなく、JSONファイルにないキーはNullとして扱われるため、これをうまく行うことができます。
前もって感謝します!
それは私の問題も修正しました!誰かがこの構成クローラーをTerraformでプロビジョニングする必要がある場合は、次のようにします。
resource "aws_glue_crawler" "crawler-s3-rawdata" {
database_name = "my_glue_database"
name = "my_crawler"
role = "my_iam_role.arn"
configuration = <<EOF
{
"Version": 1.0,
"CrawlerOutput": {
"Partitions": { "AddOrUpdateBehavior": "InheritFromTable" }
}
}
EOF
s3_target {
path = "s3://mybucket"
}
}