Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
Whisper 是Openai 开源音频转文字的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。
Whisper有五种模型尺寸,提供速度和准确性的平衡,其中English-only模型提供了四种选择。下面是可用模型的名称、大致内存需求和相对速度。
AnyDoor,由香港大学、阿里巴巴和蚂蚁集团联合研发AnyDoor,可以将一张照片上的任何物品传送到另一张图片的世界中。
AI Comic Factory是一个免费开源的AI漫画生成器,使用LLM + SDXL开发。它能够根据用户提供的提示词生成漫画,并支持无损放大、保存和打印。
miniPaint,在线PS,一个开源的Photoshop替代品,miniPaint可直接在浏览器中运行,不需要购买,下载,安装。
Magic Animate是一项开创性的开源项目,简化了动画创作,允许您从单个图像和动态视频制作动画视频。
一个视频搜索和流媒体代理工具,能让您在 ChatGPT 中与您的视频库聊天并观看视频流。
Platon.AI柏拉图智能不仅仅是 AI 爬虫,也是 AI agents 的基础设施。 AI agents 要使用工具,就必须高速阅读理解在线网页,理解网页上的每一个元素——这就是 platon.AI 的技术。
出门问问,一家以生成式AI与语音交互为核心的人工智能公司。
Janitor AI是由janitorai.com开发的一款强大的平台,允许用户创建具有不同个性的NSFW虚构聊天机器人角色。该平台由大型语言模型驱动,包括OpenAI的GPT模型。
倩言AI智能写作提供大中小学中英文作文素材、语法纠错润色、论文批改写作、托福及考研四六级作文真题提高。
腾讯音乐娱乐公司推出的一款在线音乐创作助手,包音乐分离、MIR计算、辅助写词、智能曲谱等创作工具。
一家致力于开发以人为中心的生成式视频模型的公司,Infinity AI能够通过输入剧本内容,一键生成电影。
mage.space是一个免费、快速、无过滤的稳定传播平台,由尖端人工智能技术驱动。它允许用户轻松生成想象中的独特图像。
Rosebud AI 是一家旨在借助人工智能使游戏开发更轻松、更易于访问的公司。它提供了各种工具和平台,使用户只需单击几下即可创建游戏资源、环境、角色等并为其制作动画。
一款利用AI帮助用户快速轻松生成网站的工具。Stunning.so允许用户使用文本创建网站,还可以根据用户偏好进行定制。它无需编码或技术专业知识,从而简化了网站创建过程,使每个人都可以访问。
AnyDoor,由香港大学、阿里巴巴和蚂蚁集团联合研发AnyDoor,可以将一张照片上的任何物品传送到另一张图片的世界中。