Puppeteer MCP Server は、AI エージェントにブラウザ操作の能力を与えるための MCP サーバーだ。Model Context Protocol を通じて、エージェントが Puppeteer 経由でページの閲覧・スクリーンショット取得・クリック・テキスト入力・JavaScript 実行を行える。
なぜ MCP 経由なのか
Puppeteer 自体は以前から存在するブラウザ自動化ライブラリだが、それを MCP サーバーとして包むことで、Claude のような AI エージェントが「ツール」として自然に呼び出せるようになる。エージェント側はブラウザ操作の API を意識せず、「このページを開いてフォームを埋めて」といった指示で動かせる。
効く使い方
具体的には、AI 支援によるスクレイピングや操作の自動化、E2E テストシナリオの自動生成といった用途にはまる。コンソールログを取得できるので、エージェントがページのエラーを読んで自己修正する、といった使い方も成り立つ。MIT ライセンスのオープンソースで無料、ローカルやサーバーにセルフホストする形になる。
運用上の注意点
セルフホストである以上、ヘッドレス Chrome の実行環境を自分で用意する必要がある。コンテナで動かす場合は必要な共有ライブラリの不足でブラウザが起動しない、といった環境依存のつまずきが定番だ。また AI が JavaScript を実行できるということは、エージェントが意図しないサイトを操作したり危険なスクリプトを走らせたりするリスクも伴う。信頼できない入力を扱うなら、サンドボックス化やアクセス先ドメインの制限を前提に運用したい。
向かない規模
注意したいのは、これは「エージェントが対話的にブラウザを操作する」ための道具であって、何千ページも並列にクロールする基盤ではないという点だ。ブラウザインスタンスはメモリを多く消費し、大量並列には向かない。大規模クローリングには専用のクローラー基盤のほうが効率もコストも合う。Puppeteer MCP Server の価値は、AI が一つ一つのページを「考えながら」操作する場面に出る。