이 섹션에서는 Kinesis Data Firehose가 데이터 형식 변환을 위한 스키마로 사용할 외부 테이블을 생성합니다.
1. Athena 콘솔로 이동하여 쿼리 편집기에서 Settings을 선택하고 Manage 선택
2. Browse S3를 클릭하고 버킷 목록에서 kinesis-bucket으로 시작하는 S3 버킷을 선택합니다. S3 URI에 /nyctaxitrips/
를 추가하고 Save를 클릭합니다.
i.e. s3://kinesis-bucketXXXXXx-XXXXX/nyctaxitrips/
CREATE EXTERNAL TABLE `nyctaxitrips`
(
`id` string,
`vendorId` int,
`pickupDate` string,
`dropoffDate` string,
`passengerCount` int,
`pickupLongitude` double,
`pickupLatitude` double,
`dropoffLongitude` double,
`dropoffLatitude` double,
`storeAndFwdFlag` string,
`gcDistance` double,
`tripDuration` int,
`googleDistance`int,
`googleDuration`int,
`source`string
)
PARTITIONED BY ( `year` string, `month` string, `day` string, `hour` string)
ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe'
STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat'
OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat'
LOCATION 's3://<<BUCKET-NAME>>/nyctaxitrips/'
"Query successful" 메시지가 표시됩니다.