asr2clip

asr2clip 语音转文字剪贴板工具

English

本工具旨在实时识别语音,将其转换为文字,并自动将文字复制到系统剪贴板。该工具利用 API 服务进行语音识别,并使用 Python 库进行音频捕获和剪贴板管理。

前置条件

在开始之前,请确保已准备好了以下内容:

安装

选项 1: 使用 pip 或 pipx 安装

您可以直接从 PyPI 使用 pippipx 安装 asr2clip

# 使用 pip 安装
pip install asr2clip

# 或者使用 pipx 安装(推荐用于隔离环境)
pipx install asr2clip

选项 2: 从源码安装

  1. 克隆仓库(如果适用):
git clone https://github.com/Oaklight/asr2clip.git
cd asr2clip
  1. 安装所需的 Python 包
pip install -r requirements.txt

选项 3: 使用 Conda 安装

如果您使用 Conda,可以使用提供的 environment.yaml 文件创建环境:

conda env create -f environment.yaml
conda activate asr
  1. 设置 API 密钥
    • 在项目的根目录下或您的 ~/.config/ 目录中创建一个 asr2clip.conf 文件,已提供了一个示例文件 asr2clip.conf.example
    • 将您的 API 密钥添加到 asr2clip.conf 文件中(YAML 格式):
api_key: your_api_key_here
api_base_url: https://api.openai.com/v1
model_name: whisper-1
  1. Linux 用户注意: 如果您在 Linux 上使用 pyperclip ,请确保安装了 xclipxsel 。可以通过以下命令安装:
sudo apt-get install xsel # 基础剪贴板功能,对asr2clip无差别
sudo apt-get install xclip # 功能更强,对asr2clip无差别

使用方法

  1. 运行工具
asr2clip
  1. 开始说话
    • 工具将开始从麦克风捕获音频。
    • 它将音频发送到 API 进行语音识别。
    • 识别出的文字将自动复制到系统剪贴板。
  2. 停止工具
    • Ctrl+C 停止工具。

命令行选项

asr2clip --input /path/to/audio/file.mp3
cat /path/to/audio/file.wav | asr2clip --stdin
asr2clip --duration 10
asr2clip --generate_config
asr2clip --quiet
asr2clip --config /path/to/config.conf

示例

$ ./asr2clip.py --duration 5
Recording for 5 seconds...
Recording complete.
Transcribing audio...
Transcribed Text:
-----------------
1233211234567,这是一个中文测试。
The transcribed text has been copied to the clipboard.

故障排除


贡献

如果您想为此项目做出贡献,请 fork 仓库并提交 pull request。欢迎任何改进或新功能!


许可证

本项目采用 GNU Affero 通用公共许可证 v3.0。详情请参阅 LICENSE 文件。