Amazon Rekognition は、画像や動画の中身を機械的に「理解」させるための AWS のマネージドサービスだ。物体・シーンのラベル付け、顔の検出と比較、画像内テキストの検出(OCR)、不適切コンテンツの検出までを API 一本で扱える。

効果が大きい用途

ひとつはコンテンツモデレーションだ。ユーザー投稿型のサービスで不適切な画像を人力チェックするのは限界があり、Rekognition で一次フィルタを自動化すれば運用負荷が大きく下がる。もうひとつは顔の検出・比較を使った認証や人物管理で、動画分析では人物追跡やアクティビティ検出にも踏み込める。

一次フィルタとして設計する

実務で重要なのは、検出結果を「白黒の最終判定」として扱わないことだ。Rekognition は各検出に確信度スコアを返すので、しきい値で「自動承認/自動却下/人間レビュー行き」の三段に振り分ける設計がはまる。しきい値を厳しくすれば見逃しは減るが人間レビューの量が増え、緩めれば逆になる。この調整がモデレーションシステムの運用コストを直接左右する。

料金とロックインの判断

課金は処理した画像・動画の数量ベースの従量制で、無料枠は最初の 12 か月間、月間数千画像程度。処理量に比例してコストが伸びるため、トラフィックの想定が料金感を決める。動画分析は画像より単価が高く、長尺動画を大量に処理する設計だとコストが跳ねやすい。

検討時の注意

最大の前提条件は AWS アカウントが必須なことだ。すでに AWS 上にシステムがあるなら S3 との連携も自然で導入はスムーズだが、他のクラウドで完結させたい・マルチクラウドを避けたい場合は、その時点で選択肢から外れる。同種のサービスは Google Cloud Vision や Azure の画像認識にもあり、すでに使っているクラウドに合わせて選ぶのが運用上は素直だ。精度面でも、顔認識の用途では各国の法規制や倫理的な配慮が絡むため、適用範囲を慎重に切ることが求められる。検出ラベルは英語で返るため、日本語 UI に出すなら対訳辞書を用意する手間も見込んでおきたい。