S3 Bucketのサイズ・オブジェクト数

困ったこと

AWS Backupの料金が高い。S3のStorageの料金が0.05 USD/月で、Glacierの10倍くらいする。特にでかいS3 Bucketがあったりして、どのBucketにどのくらいオブジェクトが溜まっているのか？を知りたくなった。

ただし、今はBackupの対象外にしている超巨大Bucket（数十TB）がいるので、 Storage Lens は使えなさそう。こいつはいい感じに容量の推移とかを見せてくれるけど、最大でもTop25位までのデータしか見せてくれない。

以下が一通りできれば完璧

調べたところいくつかやり方がありそう（e.g. 2009年のStackExchangeのQA）。特にサイズの方がややこしい模様

みたいBucketが数個くらいなら、Managed ConsoleのS3のページから確認できるようになっている。（Metricsのタブ）

→ 100個とかBucketがあるととても見きれないので却下

単純な方法として、 aws s3 ls --recursive --summarize --humanreadble <bucket_name> のようにして、単純にBucket内のオブジェクトを全部数えてしまうのも一つの手

ただ、以下の点からあまり現実的ではない

CloudWatchに実はMetricsがあるので、それを使ってしまえばよさそう

以下のつらみはある

S3の CloudWatchメトリクスはStorageTypeごとに分かれているので、Lifecycleなどで複数のStorageTypeを使っている場合は全部足し合わせる必要がある
CloudWatchのメトリクス取得はそこそこ複雑なので、 Bashでやり切るのは少し大変そう（シェル芸が必要になりそう）
- Inputを作るのが面倒くさい
- 足し合わせるのも面倒くさい
- もっというと、特定のメトリクスだけ Status: PartialData で返ってきて、もう一度 NextToken と一緒に問い合わせる必要がある

なのでちょっとしたPythonスクリプトを書くことにする。 Paginatorインターフェースが↑の NextToken あたりの面倒くさい部分をいい感じに吸収してくれているはず