这是一个AI文字语音处理网站,提供Whisper(OpenAI)自动语音识别系统的信息。
Whisper是由OpenAI开发的自动语音识别系统,训练集包括68万小时的多语言和多任务监督数据。使用如此大而多样的数据集可以提高对口音、背景噪音和技术语言的鲁棒性。该模型可在GitHub上使用,可以执行多语言语音识别、语音翻译和语言识别。OpenAI还提供了Whisper和ChatGPT模型的API,并且他们有一个博客,介绍最新的项目和研究。
TTS-Voice-Wizard是一个Github存储库,为用户提供了一些可访问性功能,以改善他们在VRChat中的体验。它包括语音识别和文本转语音的方法,并且也可以在VRChat之外使用。Github Wiki...
Playlistable是一个基于AI的播放列表生成器,允许用户为任何心情或场合创建个性化的播放列表。用户可以发现新音乐并自定义播放列表。该网站提供免费计划,无需信用卡,已生成超过1...
Podsqueeze是一个人工智能驱动的播客重新利用工具网站,可生成节目说明、时间戳、新闻简报等。
Musenet (OpenAI)是一个基于深度神经网络的生成模型,可生成长度为4分钟,包含10种不同乐器和多种风格的音乐作品。该模型使用了类似于GPT-2的无监督学习方法,通过学习预测数十万...
Vidan.ai是一个AI视频生成器网站,可以让用户创建吸引人的视频而无需摄像机。用户可以通过输入博客文章的URL并使用博客的文本、图像和样式生成视频来将其博客转化为视频。该网站还...
Hanami live translator是一个实时翻译工具,可捕捉来自Windows扬声器或麦克风的任何音频并将其翻译成所需的语言。