AI 光學樂譜辨識

將 PDF、掃描檔或相片轉成可完整編輯的樂譜。

Opuscan 的 AI 光學樂譜辨識(OMR)會讀取頁面上印刷的音樂內容,並將它重建成真正的記譜,讓你可以播放、移調、編排,並匯出為 MusicXML 或 MIDI。你只需提供樂譜,AI 會替你完成輸入。

莫扎特《第一弦樂四重奏》的印刷頁面,從原始雕版掃描而來。

印刷頁面

  • .musicxml
  • .midi
同一首四重奏經 Opuscan 重建後,成為乾淨、可完整編輯的樂譜。

可編輯樂譜

由 Tutteo 自家 AI 模型驅動

由我們自行開發、訓練和持續改良的識譜 AI。

每份 PDF 和相片都會由 Tutteo 自家內部的深度學習模型處理,而不是第三方引擎。它不只是辨識符號,還會按音樂語境去理解,就像受過訓練的樂手一樣,所以重建出來的樂譜才真正合乎音樂邏輯。

  • 結合節奏、音高和版面一併閱讀,按語境理解,而不是逐個符號辨識
  • 可分辨不同樂器和聲部,並將歌詞、和弦和文字對應到正確的音符
  • 從頭到尾均為自家研發,因此每次推出新版本都會帶來可量化的進步

運作方式

  1. 匯入你的樂譜你可以在電腦匯入 PDF 或圖片,或者直接在 Opuscan 手機應用程式內拍照。
  2. Opuscan 讀取頁面內容它會掃描每一頁,辨識五線譜、音符和各種記號。
  3. 檢查、編輯和匯出你的音樂會開啟為可完整編輯的樂譜。你可以檢查並修正任何內容,然後移調、播放,或匯出為 MusicXML 和 MIDI,在你慣用的樂譜編輯器中繼續處理。

用手機拍下即可。App 內置相機採用裝置上的文件掃描技術,會先找出頁面、自動裁切,並在辨識前將影像校平。拍攝越清晰,轉換結果就越準確。

Opuscan 可以辨識甚麼

Opuscan 的 OMR 專為排版好的標準西方樂譜記譜法而設,即由樂譜軟件排版或專業印刷的樂譜。這涵蓋大部分樂譜、教材、分譜和旋律譜。

效果理想

  • 印刷或數碼排版的樂譜,包括印刷頁面的掃描檔同相片
  • 獨奏分譜、鋼琴及其他大譜表樂譜,以及多樂器總譜
  • 附有和弦符號的旋律譜

不支援

  • 手寫或人手抄寫的樂譜
  • Tablature(結他/低音結他六線譜),目前尚未支援
  • 沒有標準記譜的頁面(只有文字、只有歌詞、封面頁)

支援哪些記譜法?

在排版好的西方記譜法範圍內,Opuscan 可辨識多種記號,包括:

類別Opuscan 可辨識的內容
譜號高音(G)譜號、低音(F)譜號、中音同次中音(C)譜號的所有位置、八度移位譜號同敲擊樂譜號,包括樂曲中的譜號變更
調號所有調號,由 7 個降號到 7 個升號
拍子記號分子可由 1 至 24;分母支援 1、2、4、8、16 和 32;亦支援四四拍記號和二二拍記號
音符時值由全音符至 1024 分音符,另支援 breve、long 同 maxima,並包括附點
休止符一般休止符同多小節休止符
連音三連音及其他比例(3:2、2:3、5:4、6:4、7:4、7:8、9:8 等)
符槓標準連槓、局部連槓、短尾、自訂連槓模式,以及跨休止符連槓
音高與和弦完整音域,包括加線音、和弦,以及單一譜表上的多個聲部
變音記號升記號、降記號、還原記號、重升/重降、提示性變音記號,以及微分音(四分之一音)變音記號
延音線、連音線與裝飾音延音線、連音線、裝飾音、倚音,以及提示音符(小音符)
力度與漸強/漸弱記號由 ppp 到 fff,另加 sf、sfz、fz、fp、rfz 等,並包括漸強與漸弱記號
演奏法記號斷奏、重斷奏、保持音、重音、強重音、分離連奏、換氣記號、停頓記號,以及爵士樂記號
裝飾音與震音顫音、波音、迴音、震音裝飾、滑音裝飾、海頓裝飾音、波浪線,以及 1 至 4 劃震音
線條記號與速度八度線(8va、8vb、15ma、15mb)、附 BPM 的節拍器記號,以及 rit./accel.
小節線與反覆記號普通、雙、終止、反覆及粗細小節線;反覆房子、Segno、Coda、D.C.、D.S.、To Coda,以及 Fine
小節反覆單小節反覆(%)與節奏斜線
音頭標準、X、圓圈X、十字、菱形、三角形、方形、斜線及隱藏音頭
多譜表與敲擊樂鋼琴及大譜表樂器(最多 7 個譜表)、敲擊樂譜表及音符頭
和弦符號可識別和弦符號與和弦圖,並轉為可編輯和弦,而不只是文字
演奏技巧與踏板泛音、指法、運弓、撥奏、悶音/空弦、拇指把位,以及延音踏板
文字與歌詞歌詞、排練記號及文字註釋

非拉丁字母語言的歌詞。拉丁字母語言會自動識別。日文、韓文、中文及使用西里爾字母的語言,只需在掃描前於轉換畫面選擇語言即可。

提高掃描準確度的最佳做法

AI 很強,但它只能清楚讀取頁面上看得見的內容。只要養成幾個習慣,就能大幅提升樂譜轉換的準確度。

黃金法則。如果連人眼都難以看清,AI 也一樣難以讀取。來源越乾淨、越清晰,轉換效果就越好。

建議這樣做

  • 使用高解像度掃描,或清晰、光線充足的照片
  • 將頁面平放、擺正,並填滿畫面
  • 盡量使用印刷或數碼排版的樂譜
  • 使用 App 內相機,系統會自動裁切並拉平頁面
  • 每個檔案只匯入一首作品;獨奏分譜則每個檔案只包含一個樂器聲部

哪些情況會影響識別

  • 低解像度或模糊的檔案
  • 彎曲、變形或呈弧形的五線譜(例如在書脊附近拍攝書頁)
  • 模糊偏淡、局部被擦除,或有大量標記的樂譜記號
  • 掃描瑕疵、陰影,或頁面傾斜、旋轉

光學音樂辨識詳解

什麼是光學音樂辨識(OMR)?

OMR 就像文字 OCR 在音樂上的對應技術:用軟件讀取頁面上印刷的樂譜記號,再重建成有結構、可編輯的音樂內容。Opuscan 會用 AI 模型識別五線譜、音符、節奏、歌詞和力度,然後讓你得到一份真正可以播放和匯出的樂譜。

AI 可否將樂譜 PDF 轉成可編輯的樂譜?

可以。Opuscan 可以將印刷或專業排版的樂譜 PDF 和相片轉換成完全可編輯的樂譜,並匯出標準 MusicXML 和 MIDI,供 MuseScore、Dorico、Sibelius、Flat 和任何 DAW 使用。

用手機拍攝的相片也可以嗎?

可以。App 內置相機會在辨識前使用裝置端文件掃描功能,自動找出頁面、裁切並拉平。想要最準確的結果,可以參考上面的最佳做法

支援手寫樂譜或六線譜嗎?

暫時未支援。Opuscan 係為經過排印或印刷嘅標準西方記譜法而設。手寫樂譜、結他或低音結他六線譜,以及冇標準記譜法嘅頁面都唔支援。

開發人員

自動化處理樂譜轉換。

支援 Opuscan 嘅同一套辨識技術,亦提供 API 版本。傳送 PDF 或圖片,即可取回結構化 MusicXML,方便儲存、渲染或編輯。

為大規模處理而設

一個 API,搞掂你成個目錄。

  • 上傳 PDF 或圖片,下載 MusicXML 或 MIDI
  • 同 App 背後一樣嘅模型,準確度零妥協
  • 整個目錄可批次處理,毋須人手操作

辨識技術
持續精進。

我哋會持續改善掃描效果。你可以清楚睇到每次更新咗啲咩。

探索 Opuscan 的使用情境