首页 > Ai工具箱 > Ai开源项目 > Whisper语音识别模型

Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。

# Ai开源项目

访问 Whisper语音识别模型直接访问手机查看

Whisper语音识别模型简介

Whisper 是Openai 开源音频转文字的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。

Whisper有五种模型尺寸，提供速度和准确性的平衡，其中English-only模型提供了四种选择。下面是可用模型的名称、大致内存需求和相对速度。

FaceChain AIdea

CustomNet旨在更好地将指定物品的图片融合到新生成的图片中，并确保原物品的样式和纹理细节得以还原。这项技术给SD商品图融合带来了一线生机。

ComfyUI Portrait Master 肖像大师简体中文版。超详细参数设置!再也不用为不会写人像提示词发愁!重新优化为ison列表更方便自定义和扩展。

VideoSrt是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量的为媒体（视频/音频）生成中/英文字幕、文本文件的业务场景。

泡咖AI绘画基于最新一代ChatGPT-4大语言模型和最强Ai绘画Midjourney引擎深度开发而成，泡咖AI根据中国人使用习惯，进行了深度优化，可以更好的支持中文和国内网络环境。

AnyPaint是AnyPaint推出的AI内容生成产品，其通过AI计算，为用户提供含文本、图片、音频、视频、3D模型等多模态内容生成及模型训练等功能。