MusIDE — AI 驱动的音乐创作 IDE

核心功能

从一段歌词到完整歌曲 — MusIDE 用 AI 处理整个创作流程。

🎤

DiffSinger AI 歌唱合成

业界领先的 DiffSinger（AAAI-2022）歌唱合成。输入歌词 + MIDI 音高/时长即可生成歌唱人声。使用 OpenCPOP 预训练模型，支持 K_step=100 超快速离散扩散，NSF-HiFiGAN 声码器，librosa pitch_shift 变调。

🎹

SoundFont 真实音色渲染

通过 FluidSynth + SF2 SoundFont 实现专业乐器合成，5 套优质音色库全面覆盖：Salamander C5 钢琴（24MB）、GigaPiano（17MB）、FluidR3 GM+GS 全套（144MB）、GeneralUser GS（30MB）、TimGM6mb 极简（6MB）。支持全部 128 个 General MIDI 音色 + 鼓组。

🤖

LLM 智能编排

全上下文 LLM 对话智能，支持任何 OpenAI 兼容 API。AI Agent 执行专业系统提示词，具备 20+ 工具调用，覆盖音频处理/编辑/合成、项目控制、AI 编曲等。直接通过对话生成从创作到编曲的全流程。

🎚️

多轨 DAW 编辑器

用 Web Audio API 和 Canvas 构建的专业多轨编辑器，支持最多 16 条轨道。每条轨道可独立设置名称、颜色、图标、乐器、音量、声相。支持添加/删除/拖动移动/剪切，双击进行详细音符编辑。

⏱️

时间轴与播放控制

水平时间轴，基于 BPM 的小节/拍子网格（默认 120 BPM，4/4 拍）。实时移动播放头，时间轴缩放，循环区间。完整的播放控制：播放/暂停/停止/录音/循环，时间显示，播放控制，BPM 实时调整。

🎵

音符编辑与钢琴卷帘

钢琴卷帘音符编辑器，支持拖选、批量移动/删除、对齐网格。支持 3 个八度范围（C3-B5），音高调整，音符添加/删除。编辑时实时显示音高和时值反馈。

📊

混音台

选项卡式垂直混音台视图，每个通道独立音量、声相滑块、VU 表峰值实时更新。静音/独奏按钮，通道分组，批量操作。通过 AudioContext 实时音频，支持多个同时播放。

🎼

乐理引擎

内置完整乐理模块，支持 18 种调式（大调/小调/和声小调/日本音阶等）、21 种和弦类型、20+ 和弦进行、7 种终止式、4 种典型结构模板。AI Agent 编曲时根据风格自动选择合适的调式、和弦进行。

🎙️

音源分离

通过 Demucs 进行 AI 音源分离（可自定义：人声/鼓/贝斯/其他）。基于 Whisper 的语音识别，音频转文字。后台线程异步处理，实时进度更新。

📁

项目管理

完整文件管理器：创建/上传/下载/删除，自动识别音频文件。完整 Git 集成（status/log/branch/stage/commit/push/pull/checkout/clone/diff/stash）。内置终端、项目设置、查找替换、移动端响应式 UI。

快速开始

全平台一键安装。默认地址：http://localhost:12346

# Windows（PowerShell）
irm https://music.samai.cc/install.ps1 | iex

# Linux / macOS / Termux
curl -fsSL https://music.samai.cc/install.sh | bash

# 手动安装
pip install flask flask-cors
# 从授权仓库克隆
git clone <你的仓库地址>
cd muside
python muside_server.py
# → 打开 http://localhost:12346

# 自定义安装目录
MUSIDE_INSTALL_DIR=~/my-muside curl -fsSL https://music.samai.cc/install.sh | bash

# 自定义端口
MUSIDE_PORT=8080 curl -fsSL https://music.samai.cc/install.sh | bash

# Docker
docker run -d -p 12346:12346 -v ~/muside_workspace:/workspace python:3.12-slim bash -c \
  "pip install flask flask-cors && git clone --depth 1 <你的仓库地址> /muside && cd /muside && MUSIDE_WORKSPACE=/workspace python3 muside_server.py"

跨平台支持

一份代码，Python 能跑的地方都能跑。

🪟

Windows 10/11

PowerShell 一键安装

🐧

Linux

Ubuntu / Debian / Fedora / CentOS / Arch / openSUSE / Alpine

🍎

macOS

Homebrew Python

📱

Termux（Android）

pkg install python

🐳

Docker

python:3.12-slim 镜像

💻

WSL

Windows Subsystem for Linux

架构

模块化的 Flask 服务，丰富的路由蓝图 + Catppuccin 主题 Web UI。

samaidev/muside/
├── muside_server.py              # Flask 入口，注册 Blueprint
├── utils.py                      # 通用工具函数
├── music_theory.py               # 乐理（调式/和弦/进行/结构）
├── sf2_renderer.py               # SF2 SoundFont 渲染器 + MIDIBuilder + GM 映射
├── diffsinger_svs.py             # DiffSinger AI 歌唱合成（AAAI-2022）
├── audio_tools.py                # 音频处理工具
├── requirements.txt              # Python 依赖
├── install.sh / install.ps1      # 全自动安装脚本（含 DiffSinger）
├── start.sh                      # 启动脚本
├── soundfonts/                   # SF2 音色库
│   ├── SalC5Light2.sf2           # Salamander C5 钢琴 (24MB)
│   ├── GigaPiano.sf2             # Giga Piano (17MB)
│   ├── FluidR3_GM_GS.sf2         # FluidR3 全套 (144MB)
│   ├── GeneralUser_GS.sf2        # GeneralUser GS (30MB)
│   └── TimGM6mb.sf2              # TimGM6mb 极简 (6MB)
├── diffsinger_repo/              # DiffSinger 模型仓库（AAAI-2022）
│   └── checkpoints/              # 预训练模型（OpenCPOP、NSF-HiFiGAN 等）
├── routes/
│   ├── files.py                  # 文件 CRUD
│   ├── run.py                    # 代码执行
│   ├── git.py                    # Git 操作
│   ├── chat.py                   # LLM 对话 + AI Agent（20+ 工具）
│   ├── audio.py                  # 音频：AI 合成、音源分离
│   ├── venv.py                   # 虚拟环境管理
│   ├── server_mgmt.py            # 服务器管理
│   └── browser.py                # 浏览器工具
└── static/
    ├── index.html                # 主页 DAW 界面
    ├── css/style.css             # Catppuccin 主题，响应式
    └── js/
        ├── app.js                # 主控器
        ├── track-editor.js       # 多轨 DAW 编辑器
        ├── chat.js               # LLM 对话 + Agent
        ├── files.js              # 文件管理
        ├── git.js                # Git 面板
        ├── search.js             # 全局查找替换
        └── terminal.js           # 内置终端