apihub 日本語開発者向けリソースハブ

AI Category

音声認識

音声データを文字に書き起こす音声認識の API をまとめた区分です。会議録の自動化や音声入力機能を作る開発者が利用します。リアルタイム処理に対応するか、話者分離や雑音への強さがどの程度かで使い勝手が大きく変わるため、収録環境と求める書き起こし精度を踏まえて比較してください。

このカテゴリのリソース

4 件

Deepgram API

Deepgram

高速で精度の高い多言語音声認識API

Hugging Face Inference API

Hugging Face

20万超のOSSモデルをAPI経由で推論

OpenAI API

OpenAI

GPT-4o系と画像・音声まで網羅する最大手AI API

Whisper API (OpenAI)

OpenAI

OpenAI提供の高精度多言語音声認識API