AI 光學樂譜辨識

將 PDF、掃描檔或相片轉成可完整編輯的樂譜。

Opuscan 的 AI 光學樂譜辨識（OMR）會讀取頁面上印刷的音樂內容，並將它重建成真正的記譜，讓你可以播放、移調、編排，並匯出為 MusicXML 或 MIDI。你只需提供樂譜，AI 會替你完成輸入。

印刷頁面

.musicxml
.midi

可編輯樂譜

由 Tutteo 自家 AI 模型驅動

由我們自行開發、訓練和持續改良的識譜 AI。

每份 PDF 和相片都會由 Tutteo 自家內部的深度學習模型處理，而不是第三方引擎。它不只是辨識符號，還會按音樂語境去理解，就像受過訓練的樂手一樣，所以重建出來的樂譜才真正合乎音樂邏輯。

結合節奏、音高和版面一併閱讀，按語境理解，而不是逐個符號辨識
可分辨不同樂器和聲部，並將歌詞、和弦和文字對應到正確的音符
從頭到尾均為自家研發，因此每次推出新版本都會帶來可量化的進步

運作方式

匯入你的樂譜你可以在電腦匯入 PDF 或圖片，或者直接在 Opuscan 手機應用程式內拍照。
Opuscan 讀取頁面內容它會掃描每一頁，辨識五線譜、音符和各種記號。
檢查、編輯和匯出你的音樂會開啟為可完整編輯的樂譜。你可以檢查並修正任何內容，然後移調、播放，或匯出為 MusicXML 和 MIDI，在你慣用的樂譜編輯器中繼續處理。

用手機拍下即可。App 內置相機採用裝置上的文件掃描技術，會先找出頁面、自動裁切，並在辨識前將影像校平。拍攝越清晰，轉換結果就越準確。

Opuscan 可以辨識甚麼

Opuscan 的 OMR 專為排版好的標準西方樂譜記譜法而設，即由樂譜軟件排版或專業印刷的樂譜。這涵蓋大部分樂譜、教材、分譜和旋律譜。

效果理想

印刷或數碼排版的樂譜，包括印刷頁面的掃描檔同相片
獨奏分譜、鋼琴及其他大譜表樂譜，以及多樂器總譜
附有和弦符號的旋律譜

不支援

手寫或人手抄寫的樂譜
Tablature（結他／低音結他六線譜），目前尚未支援
沒有標準記譜的頁面（只有文字、只有歌詞、封面頁）

支援哪些記譜法？

在排版好的西方記譜法範圍內，Opuscan 可辨識多種記號，包括：

類別	Opuscan 可辨識的內容
譜號	高音（G）譜號、低音（F）譜號、中音同次中音（C）譜號的所有位置、八度移位譜號同敲擊樂譜號，包括樂曲中的譜號變更
調號	所有調號，由 7 個降號到 7 個升號
拍子記號	分子可由 1 至 24；分母支援 1、2、4、8、16 和 32；亦支援四四拍記號和二二拍記號
音符時值	由全音符至 1024 分音符，另支援 breve、long 同 maxima，並包括附點
休止符	一般休止符同多小節休止符
連音	三連音及其他比例（3:2、2:3、5:4、6:4、7:4、7:8、9:8 等）
符槓	標準連槓、局部連槓、短尾、自訂連槓模式，以及跨休止符連槓
音高與和弦	完整音域，包括加線音、和弦，以及單一譜表上的多個聲部
變音記號	升記號、降記號、還原記號、重升／重降、提示性變音記號，以及微分音（四分之一音）變音記號
延音線、連音線與裝飾音	延音線、連音線、裝飾音、倚音，以及提示音符（小音符）
力度與漸強／漸弱記號	由 ppp 到 fff，另加 sf、sfz、fz、fp、rfz 等，並包括漸強與漸弱記號
演奏法記號	斷奏、重斷奏、保持音、重音、強重音、分離連奏、換氣記號、停頓記號，以及爵士樂記號
裝飾音與震音	顫音、波音、迴音、震音裝飾、滑音裝飾、海頓裝飾音、波浪線，以及 1 至 4 劃震音
線條記號與速度	八度線（8va、8vb、15ma、15mb）、附 BPM 的節拍器記號，以及 rit.／accel.
小節線與反覆記號	普通、雙、終止、反覆及粗細小節線；反覆房子、Segno、Coda、D.C.、D.S.、To Coda，以及 Fine
小節反覆	單小節反覆（%）與節奏斜線
音頭	標準、X、圓圈X、十字、菱形、三角形、方形、斜線及隱藏音頭
多譜表與敲擊樂	鋼琴及大譜表樂器（最多 7 個譜表）、敲擊樂譜表及音符頭
和弦符號	可識別和弦符號與和弦圖，並轉為可編輯和弦，而不只是文字
演奏技巧與踏板	泛音、指法、運弓、撥奏、悶音／空弦、拇指把位，以及延音踏板
文字與歌詞	歌詞、排練記號及文字註釋

非拉丁字母語言的歌詞。拉丁字母語言會自動識別。日文、韓文、中文及使用西里爾字母的語言，只需在掃描前於轉換畫面選擇語言即可。

提高掃描準確度的最佳做法

AI 很強，但它只能清楚讀取頁面上看得見的內容。只要養成幾個習慣，就能大幅提升樂譜轉換的準確度。

黃金法則。如果連人眼都難以看清，AI 也一樣難以讀取。來源越乾淨、越清晰，轉換效果就越好。

建議這樣做

使用高解像度掃描，或清晰、光線充足的照片
將頁面平放、擺正，並填滿畫面
盡量使用印刷或數碼排版的樂譜
使用 App 內相機，系統會自動裁切並拉平頁面
每個檔案只匯入一首作品；獨奏分譜則每個檔案只包含一個樂器聲部

哪些情況會影響識別

低解像度或模糊的檔案
彎曲、變形或呈弧形的五線譜（例如在書脊附近拍攝書頁）
模糊偏淡、局部被擦除，或有大量標記的樂譜記號
掃描瑕疵、陰影，或頁面傾斜、旋轉

光學音樂辨識詳解

什麼是光學音樂辨識（OMR）？

OMR 就像文字 OCR 在音樂上的對應技術：用軟件讀取頁面上印刷的樂譜記號，再重建成有結構、可編輯的音樂內容。Opuscan 會用 AI 模型識別五線譜、音符、節奏、歌詞和力度，然後讓你得到一份真正可以播放和匯出的樂譜。

AI 可否將樂譜 PDF 轉成可編輯的樂譜？

可以。Opuscan 可以將印刷或專業排版的樂譜 PDF 和相片轉換成完全可編輯的樂譜，並匯出標準 MusicXML 和 MIDI，供 MuseScore、Dorico、Sibelius、Flat 和任何 DAW 使用。

用手機拍攝的相片也可以嗎？

可以。App 內置相機會在辨識前使用裝置端文件掃描功能，自動找出頁面、裁切並拉平。想要最準確的結果，可以參考上面的最佳做法。

支援手寫樂譜或六線譜嗎？

暫時未支援。Opuscan 係為經過排印或印刷嘅標準西方記譜法而設。手寫樂譜、結他或低音結他六線譜，以及冇標準記譜法嘅頁面都唔支援。

開發人員

自動化處理樂譜轉換。

支援 Opuscan 嘅同一套辨識技術，亦提供 API 版本。傳送 PDF 或圖片，即可取回結構化 MusicXML，方便儲存、渲染或編輯。

為大規模處理而設

一個 API，搞掂你成個目錄。

上傳 PDF 或圖片，下載 MusicXML 或 MIDI
同 App 背後一樣嘅模型，準確度零妥協
整個目錄可批次處理，毋須人手操作

閱讀 API 文件聯絡我們

opuscan-omr

# Create an OMR job, then add pages to it
POST /v2/omr/jobs
Authorization: Bearer your_access_token
Content-Type: application/json

{ "output": "musicxml" }
201 Created
{
  "id": "6650f1c2a4e3b90012ab34cd",
  "status": "draft",
  "output": "musicxml"
}

辨識技術
持續精進。

我哋會持續改善掃描效果。你可以清楚睇到每次更新咗啲咩。

查看 OMR 更新日誌

探索 Opuscan 的使用情境