v1.0 · DiffSinger + SoundFont + LLM Agent

AI 驱动的
音乐创作 IDE

MusIDE 是专业 DAW 的 AI 替代品,核心功能全部通过 AI 实现。从一段歌词到完整歌曲 — DiffSinger 歌唱合成、SoundFont 真实音色渲染、LLM Agent 20+ 工具调用全流程编排,直接通过对话生成从创作到编曲的全流程。

DiffSinger
AI 歌唱合成
5 SF2
SoundFont 音色库
20+
LLM Agent 工具
16
DAW 轨道

核心功能

从一段歌词到完整歌曲 — MusIDE 用 AI 处理整个创作流程。

🎤

DiffSinger AI 歌唱合成

业界领先的 DiffSinger(AAAI-2022)歌唱合成。输入歌词 + MIDI 音高/时长即可生成歌唱人声。使用 OpenCPOP 预训练模型,支持 K_step=100 超快速离散扩散,NSF-HiFiGAN 声码器,librosa pitch_shift 变调。

🎹

SoundFont 真实音色渲染

通过 FluidSynth + SF2 SoundFont 实现专业乐器合成,5 套优质音色库全面覆盖:Salamander C5 钢琴(24MB)、GigaPiano(17MB)、FluidR3 GM+GS 全套(144MB)、GeneralUser GS(30MB)、TimGM6mb 极简(6MB)。支持全部 128 个 General MIDI 音色 + 鼓组。

🤖

LLM 智能编排

全上下文 LLM 对话智能,支持任何 OpenAI 兼容 API。AI Agent 执行专业系统提示词,具备 20+ 工具调用,覆盖音频处理/编辑/合成、项目控制、AI 编曲等。直接通过对话生成从创作到编曲的全流程。

🎚️

多轨 DAW 编辑器

用 Web Audio API 和 Canvas 构建的专业多轨编辑器,支持最多 16 条轨道。每条轨道可独立设置名称、颜色、图标、乐器、音量、声相。支持添加/删除/拖动移动/剪切,双击进行详细音符编辑。

⏱️

时间轴与播放控制

水平时间轴,基于 BPM 的小节/拍子网格(默认 120 BPM,4/4 拍)。实时移动播放头,时间轴缩放,循环区间。完整的播放控制:播放/暂停/停止/录音/循环,时间显示,播放控制,BPM 实时调整。

🎵

音符编辑与钢琴卷帘

钢琴卷帘音符编辑器,支持拖选、批量移动/删除、对齐网格。支持 3 个八度范围(C3-B5),音高调整,音符添加/删除。编辑时实时显示音高和时值反馈。

📊

混音台

选项卡式垂直混音台视图,每个通道独立音量、声相滑块、VU 表峰值实时更新。静音/独奏按钮,通道分组,批量操作。通过 AudioContext 实时音频,支持多个同时播放。

🎼

乐理引擎

内置完整乐理模块,支持 18 种调式(大调/小调/和声小调/日本音阶等)、21 种和弦类型、20+ 和弦进行、7 种终止式、4 种典型结构模板。AI Agent 编曲时根据风格自动选择合适的调式、和弦进行。

🎙️

音源分离

通过 Demucs 进行 AI 音源分离(可自定义:人声/鼓/贝斯/其他)。基于 Whisper 的语音识别,音频转文字。后台线程异步处理,实时进度更新。

📁

项目管理

完整文件管理器:创建/上传/下载/删除,自动识别音频文件。完整 Git 集成(status/log/branch/stage/commit/push/pull/checkout/clone/diff/stash)。内置终端、项目设置、查找替换、移动端响应式 UI。

快速开始

全平台一键安装。默认地址:http://localhost:12346

# Windows(PowerShell) irm https://music.samai.cc/install.ps1 | iex # Linux / macOS / Termux curl -fsSL https://music.samai.cc/install.sh | bash # 手动安装 pip install flask flask-cors # 从授权仓库克隆 git clone <你的仓库地址> cd muside python muside_server.py # → 打开 http://localhost:12346 # 自定义安装目录 MUSIDE_INSTALL_DIR=~/my-muside curl -fsSL https://music.samai.cc/install.sh | bash # 自定义端口 MUSIDE_PORT=8080 curl -fsSL https://music.samai.cc/install.sh | bash # Docker docker run -d -p 12346:12346 -v ~/muside_workspace:/workspace python:3.12-slim bash -c \ "pip install flask flask-cors && git clone --depth 1 <你的仓库地址> /muside && cd /muside && MUSIDE_WORKSPACE=/workspace python3 muside_server.py"

跨平台支持

一份代码,Python 能跑的地方都能跑。

🪟
Windows 10/11
PowerShell 一键安装
🐧
Linux
Ubuntu / Debian / Fedora / CentOS / Arch / openSUSE / Alpine
🍎
macOS
Homebrew Python
📱
Termux(Android)
pkg install python
🐳
Docker
python:3.12-slim 镜像
💻
WSL
Windows Subsystem for Linux

架构

模块化的 Flask 服务,丰富的路由蓝图 + Catppuccin 主题 Web UI。

samaidev/muside/ ├── muside_server.py # Flask 入口,注册 Blueprint ├── utils.py # 通用工具函数 ├── music_theory.py # 乐理(调式/和弦/进行/结构) ├── sf2_renderer.py # SF2 SoundFont 渲染器 + MIDIBuilder + GM 映射 ├── diffsinger_svs.py # DiffSinger AI 歌唱合成(AAAI-2022) ├── audio_tools.py # 音频处理工具 ├── requirements.txt # Python 依赖 ├── install.sh / install.ps1 # 全自动安装脚本(含 DiffSinger) ├── start.sh # 启动脚本 ├── soundfonts/ # SF2 音色库 │ ├── SalC5Light2.sf2 # Salamander C5 钢琴 (24MB) │ ├── GigaPiano.sf2 # Giga Piano (17MB) │ ├── FluidR3_GM_GS.sf2 # FluidR3 全套 (144MB) │ ├── GeneralUser_GS.sf2 # GeneralUser GS (30MB) │ └── TimGM6mb.sf2 # TimGM6mb 极简 (6MB) ├── diffsinger_repo/ # DiffSinger 模型仓库(AAAI-2022) │ └── checkpoints/ # 预训练模型(OpenCPOP、NSF-HiFiGAN 等) ├── routes/ │ ├── files.py # 文件 CRUD │ ├── run.py # 代码执行 │ ├── git.py # Git 操作 │ ├── chat.py # LLM 对话 + AI Agent(20+ 工具) │ ├── audio.py # 音频:AI 合成、音源分离 │ ├── venv.py # 虚拟环境管理 │ ├── server_mgmt.py # 服务器管理 │ └── browser.py # 浏览器工具 └── static/ ├── index.html # 主页 DAW 界面 ├── css/style.css # Catppuccin 主题,响应式 └── js/ ├── app.js # 主控器 ├── track-editor.js # 多轨 DAW 编辑器 ├── chat.js # LLM 对话 + Agent ├── files.js # 文件管理 ├── git.js # Git 面板 ├── search.js # 全局查找替换 └── terminal.js # 内置终端