Fetch MCP Server は、AI エージェントに「Web ページを読む」能力を与える MCP サーバーだ。Anthropic の公式リファレンス実装で、URL を渡すとそのページを取得し、HTML をマークダウンに変換して返す。

なぜマークダウン変換が肝なのか

このサーバーの本質は、単に HTML を取ってくることではなくマークダウンへの変換にある。生の HTML はタグやスクリプト、スタイルでノイズが多く、そのまま LLM に渡すとコンテキストを浪費し、肝心の本文が埋もれる。Fetch MCP Server は本文を抽出してマークダウンに整形するため、エージェントが処理しやすく、トークン効率もよい形でコンテンツが渡る。

実用上は、AI エージェントによる Web 調査や、ドキュメント URL の内容取得・要約で活きる。「この URL の記事を要約して」と頼めば、取得から整形までをサーバーが引き受ける。robots.txt の尊重やリダイレクト追従も組み込まれており、行儀のよい取得ができる。

明確な限界

致命的な制約は、JavaScript で動的にレンダリングされる SPA を扱えないことだ。Fetch MCP Server は HTTP で取得した HTML をそのまま処理するため、ブラウザ上で JS が実行されて初めて中身が現れるページは、ほぼ空のコンテンツしか返さない。コンテンツが JS 描画かどうかは、取得結果が薄いときに最初に疑うべき点だ。動的レンダリングが必要なら、実ブラウザを動かす Puppeteer 系の MCP サーバーが必要になる。

取得が弾かれるケースにも備える

もう 1 つ実務で遭遇するのが、取得そのものが拒否される状況だ。ログイン必須のページ、ボット対策で User-Agent やアクセスパターンを見て弾くサイト、地域制限のあるコンテンツなどは、URL を渡しても本文が返らない。robots.txt で取得が禁じられているパスも尊重される。長文ページではコンテキスト長に収まらず途中で切られることもあるため、調査用途では「取得できなかった/不完全だった」場合のフォールバックをエージェント側のフローに織り込んでおくと安定する。

MIT ライセンスで無料。静的な HTML ページの取得という守備範囲なら、軽量で素直に使えるサーバーだ。