AI 光學樂譜辨識

將 PDF、掃描檔或照片轉成可完整編輯的樂譜。

Opuscan 的 AI 光學樂譜辨識（OMR）會讀取頁面上印刷的音樂內容，並將其重建為真正的記譜，讓您可以播放、移調、編配，並匯出為 MusicXML 或 MIDI。您提供樂譜，AI 負責輸入。

印刷頁面

.musicxml
.midi

可編輯樂譜

由 Tutteo 自家的 AI 模型驅動

由我們自行打造、訓練並持續改進的辨識 AI。

每一份 PDF 和照片，都由 Tutteo 自家的內部深度學習模型處理，而不是第三方引擎。它不只是辨認符號，還會像受過訓練的音樂家一樣，在音樂脈絡中讀懂它們，因此重建出的樂譜才真正合乎音樂邏輯。

不是逐一辨認符號，而是結合節奏、音高與版面配置，依脈絡整體判讀
能分辨不同樂器與聲部，並將歌詞、和弦與文字正確對應到相應的音符
從頭到尾由我們內部自行打造，因此每次發佈都能帶來可衡量的進步

運作方式

匯入您的樂譜在電腦上匯入 PDF 或圖片，或直接在 Opuscan 手機應用程式中拍照。
Opuscan 讀取頁面內容它會掃描每一頁，辨識五線譜、音符和各種記號。
檢查、編修並匯出您的樂譜會以可完整編輯的樂譜開啟。確認並修正任何內容後，您可以移調、改編、播放，或匯出為 MusicXML 和 MIDI，交給您慣用的制譜軟體。

用手機直接擷取。 內建相機使用裝置端文件掃描技術，能在辨識前自動找出頁面、裁切並校正攤平影像。擷取越乾淨，轉換就越精準。

Opuscan 可以讀取哪些內容

Opuscan 的 OMR 是為已排版的標準西方音樂記譜而設計，也就是由制譜軟體編排或專業印刷的樂譜。這涵蓋了大多數的樂譜、教材、分譜和旋律譜。

效果良好

印刷版或數位排版的樂譜，包括印刷頁面的掃描檔和照片
獨奏分譜、鋼琴與其他大譜表樂譜，以及多樂器總譜
含和弦記號的旋律譜

不支援

手寫或人工抄寫的樂譜
Tablature（吉他／貝斯指法譜），目前尚未支援
沒有標準記譜的頁面（純文字、純歌詞、封面頁）

支援哪些記譜法？

在已排版的西方音樂記譜範圍內，Opuscan 能辨識多種記號，包括：

類別	Opuscan 可辨識的內容
譜號	高音譜號（G）、低音譜號（F）、中音與次中音譜號（C）的所有位置、移高或移低八度譜號，以及打擊樂譜號，也包括樂曲中的譜號變換
調號	所有調號，從 7 個降記號到 7 個升記號
拍號	分子可為 1 到 24 的任意數值，分母支援 1、2、4、8、16 和 32，另包含常用拍號與二二拍
音符時值	從全音符到 1024 分音符，另支援倍全音符、長音符和大長音符，以及附點
休止符	一般休止符與多小節休止符
連音	三連音與其他比例（3:2、2:3、5:4、6:4、7:4、7:8、9:8 等）
符槓	標準連槓、部分連槓、旗形、各種自訂連槓方式，以及跨休止符的連槓
音高與和弦	涵蓋完整音域，支援加線音符、和弦，以及單一譜表上的多聲部
變音記號	升記號、降記號、還原記號、重升／重降、提示性變音記號，以及微分音（四分之一音）變音記號
延音線、圓滑線與裝飾音	延音線、圓滑線、裝飾音、倚音，以及提示音符（小音符）
力度與漸強／漸弱記號	從 ppp 到 fff，另含 sf、sfz、fz、fp、rfz 等記號，以及漸強與漸弱髮夾
演奏法記號	斷奏、頓斷奏、保持音、重音、馬卡托、分離連奏、換氣記號、停頓記號，以及爵士記號
裝飾音與震音	顫音、波音、回音、震音裝飾、滑音裝飾、海頓裝飾音、波浪線，以及 1 到 4 劃震音
線條與速度	八度線（8va、8vb、15ma、15mb）、附 BPM 的速度記號，以及 rit.／accel.
小節線與反覆記號	一般、雙、終止、反覆，以及粗細複小節線；一房子／二房子、Segno、Coda、D.C.、D.S.、To Coda，以及 Fine
小節反覆	單小節反覆（%）與節奏斜線
音頭	標準、X、圓圈 X、十字、菱形、三角形、方形、斜線，以及隱藏音頭
多譜表與打擊樂	鋼琴與大譜表樂器（最多 7 個譜表）、打擊樂譜表與打擊樂音頭
和弦記號	和弦記號與和弦圖，會辨識為可編輯的和弦，而不只是文字
演奏技巧與踏板	泛音、指法、運弓、撥奏、按弦／空弦、拇指把位，以及延音踏板
文字與歌詞	歌詞、排練記號與文字註記

非拉丁文字的歌詞。使用拉丁字母的語言會自動辨識。日文、韓文、中文與使用西里爾字母的語言，只要在掃描前先在轉換畫面中選擇語言即可。

提高掃描準確度的最佳做法

AI 很厲害，但它只能清楚讀取頁面上看得見的內容。養成幾個小習慣，就能大幅提升樂譜轉換的準確度。

黃金法則。如果連人都很難看清楚，AI 也會很難辨識。來源越乾淨、越清晰，轉換效果就越好。

請這樣做

使用高解析度掃描，或清晰、光線充足的照片
將頁面平放，端正地填滿畫面
優先使用印刷版或數位排版的樂譜
使用 app 內相機，系統會自動裁切並校正頁面
每個檔案只匯入一首作品，獨奏分譜也請每個檔案只放一種樂器

哪些情況會影響辨識

低解析度或模糊的檔案
彎曲、變形或弧形的五線譜（拍攝靠近書脊的書頁時常見）
顏色淡、部分被擦除，或有大量標記的樂譜記號
掃描雜訊、陰影，或傾斜、旋轉的頁面

光學樂譜辨識說明

什麼是光學樂譜辨識（OMR）？

OMR 就像是文字領域中的 OCR 在音樂上的對應技術，也就是能讀取頁面上印刷樂譜記號，並將其重建為結構化、可編輯樂譜的軟體。Opuscan 使用 AI 模型辨識五線譜、音符、節奏、歌詞和力度記號，接著產生可播放、可匯出的真正樂譜。

AI 能把 PDF 樂譜轉成可編輯的樂譜嗎？

可以。Opuscan 可將印刷或數位排版的 PDF 樂譜與照片轉換為完全可編輯的樂譜，並匯出標準 MusicXML 和 MIDI，供 MuseScore、Dorico、Sibelius、Flat 與任何 DAW 使用。

用手機拍的照片也能用嗎？

可以。App 內建相機會使用裝置端的文件掃描功能，在辨識前先找出頁面、自動裁切並拉平。若想獲得最準確的結果，請參考上方的最佳做法。

支援手寫樂譜或六線譜嗎？

目前還不支援。Opuscan 是為雕版或印刷的標準西洋記譜法而設計。手寫樂譜、吉他或貝斯六線譜，以及不含標準記譜法的頁面都不支援。

開發者

自動化樂譜轉換。

驅動 Opuscan 的同一套辨識能力，也提供 API 形式使用。傳送 PDF 或圖片，即可取得結構化的 MusicXML，方便儲存、呈現或編輯。

為大規模處理而打造

一個 API，搞定您的整個目錄。

上傳 PDF 或圖片，下載 MusicXML 或 MIDI
與 App 相同的模型，準確度毫不妥協
整批處理整個目錄，無需人工介入

閱讀 API 文件聯絡我們

opuscan-omr

# Create an OMR job, then add pages to it
POST /v2/omr/jobs
Authorization: Bearer your_access_token
Content-Type: application/json

{ "output": "musicxml" }
201 Created
{
  "id": "6650f1c2a4e3b90012ab34cd",
  "status": "draft",
  "output": "musicxml"
}

持續進步的
持續進步。

我們持續改進掃描功能。每次更新了什麼，都清楚列給您看。

查看 OMR 更新記錄

探索 Opuscan 的使用情境