AI Category
音声認識
音声データを文字に書き起こす音声認識の API をまとめた区分です。会議録の自動化や音声入力機能を作る開発者が利用します。リアルタイム処理に対応するか、話者分離や雑音への強さがどの程度かで使い勝手が大きく変わるため、収録環境と求める書き起こし精度を踏まえて比較してください。
このカテゴリのリソース
4 件
API
Deepgram API
Deepgram
高速で精度の高い多言語音声認識API
API
Hugging Face Inference API
Hugging Face
20万超のOSSモデルをAPI経由で推論
API
OpenAI API
OpenAI
GPT-4o系と画像・音声まで網羅する最大手AI API
API
Whisper API (OpenAI)
OpenAI
OpenAI提供の高精度多言語音声認識API