MorningAI

首页

目录

【语音】 Whisper - 语音转文本

Whisper

Whisper 是OpenAI开源的通用语音识别模型,可以支持语音识别,语音翻译,语言识别等功能。

本镜像部署的是Whisper-WebUI ,支持 openai/whisperSYSTRAN/faster-whisperVaibhavs10/insanely-fast-whisper,并提供Gradio-based浏览器交互使用的界面。

访问

服务通过Docker进行部署,默认监听到内网8000端口,请通过8000对应的外网端口访问。

  • 1. 查看访问地址,默认监听到内网8000端口,可通过8000对应的外网端口放
    image.png#584px #244px

  • 2. 控制台上查看IP

  • 3. 访问服务

    	http://外网IP:381xx

使用

  • 1. 通过WebUI交互使用
    image.png#1200px #800px

  • 2. 通过API访问,在Gradio
    image.png#1200px #800px

  • 3. SSH登录系统,然后进入到Docker容器通过命令行执行

    • a. SSH信息请在控制台上查看,并登录系统

    • b. 进入Docker容器

      sudo docker ps -a
      sudo docker exec -it 9c57eed5fef6 /bin/bash
      
      /Whisper-WebUI/venv/bin/whisper 

      image.png#1200px #220px