AI 光學樂譜辨識

將 PDF、掃描檔或照片轉成可完整編輯的樂譜。

Opuscan 的 AI 光學樂譜辨識(OMR)會讀取頁面上印刷的音樂內容,並將其重建為真正的記譜,讓您可以播放、移調、編配,並匯出為 MusicXML 或 MIDI。您提供樂譜,AI 負責輸入。

莫札特第一號弦樂四重奏的印刷頁面,掃描自原始雕版印刷。

印刷頁面

  • .musicxml
  • .midi
同一首四重奏由 Opuscan 重建為乾淨、可完整編輯的樂譜。

可編輯樂譜

由 Tutteo 自家的 AI 模型驅動

由我們自行打造、訓練並持續改進的辨識 AI。

每一份 PDF 和照片,都由 Tutteo 自家的內部深度學習模型處理,而不是第三方引擎。它不只是辨認符號,還會像受過訓練的音樂家一樣,在音樂脈絡中讀懂它們,因此重建出的樂譜才真正合乎音樂邏輯。

  • 不是逐一辨認符號,而是結合節奏、音高與版面配置,依脈絡整體判讀
  • 能分辨不同樂器與聲部,並將歌詞、和弦與文字正確對應到相應的音符
  • 從頭到尾由我們內部自行打造,因此每次發佈都能帶來可衡量的進步

運作方式

  1. 匯入您的樂譜在電腦上匯入 PDF 或圖片,或直接在 Opuscan 手機應用程式中拍照。
  2. Opuscan 讀取頁面內容它會掃描每一頁,辨識五線譜、音符和各種記號。
  3. 檢查、編修並匯出您的樂譜會以可完整編輯的樂譜開啟。確認並修正任何內容後,您可以移調、改編、播放,或匯出為 MusicXML 和 MIDI,交給您慣用的制譜軟體。

用手機直接擷取。 內建相機使用裝置端文件掃描技術,能在辨識前自動找出頁面、裁切並校正攤平影像。擷取越乾淨,轉換就越精準。

Opuscan 可以讀取哪些內容

Opuscan 的 OMR 是為已排版的標準西方音樂記譜而設計,也就是由制譜軟體編排或專業印刷的樂譜。這涵蓋了大多數的樂譜、教材、分譜和旋律譜。

效果良好

  • 印刷版或數位排版的樂譜,包括印刷頁面的掃描檔和照片
  • 獨奏分譜、鋼琴與其他大譜表樂譜,以及多樂器總譜
  • 含和弦記號的旋律譜

不支援

  • 手寫或人工抄寫的樂譜
  • Tablature(吉他/貝斯指法譜),目前尚未支援
  • 沒有標準記譜的頁面(純文字、純歌詞、封面頁)

支援哪些記譜法?

在已排版的西方音樂記譜範圍內,Opuscan 能辨識多種記號,包括:

類別Opuscan 可辨識的內容
譜號高音譜號(G)、低音譜號(F)、中音與次中音譜號(C)的所有位置、移高或移低八度譜號,以及打擊樂譜號,也包括樂曲中的譜號變換
調號所有調號,從 7 個降記號到 7 個升記號
拍號分子可為 1 到 24 的任意數值,分母支援 1、2、4、8、16 和 32,另包含常用拍號與二二拍
音符時值從全音符到 1024 分音符,另支援倍全音符、長音符和大長音符,以及附點
休止符一般休止符與多小節休止符
連音三連音與其他比例(3:2、2:3、5:4、6:4、7:4、7:8、9:8 等)
符槓標準連槓、部分連槓、旗形、各種自訂連槓方式,以及跨休止符的連槓
音高與和弦涵蓋完整音域,支援加線音符、和弦,以及單一譜表上的多聲部
變音記號升記號、降記號、還原記號、重升/重降、提示性變音記號,以及微分音(四分之一音)變音記號
延音線、圓滑線與裝飾音延音線、圓滑線、裝飾音、倚音,以及提示音符(小音符)
力度與漸強/漸弱記號從 ppp 到 fff,另含 sf、sfz、fz、fp、rfz 等記號,以及漸強與漸弱髮夾
演奏法記號斷奏、頓斷奏、保持音、重音、馬卡托、分離連奏、換氣記號、停頓記號,以及爵士記號
裝飾音與震音顫音、波音、回音、震音裝飾、滑音裝飾、海頓裝飾音、波浪線,以及 1 到 4 劃震音
線條與速度八度線(8va、8vb、15ma、15mb)、附 BPM 的速度記號,以及 rit./accel.
小節線與反覆記號一般、雙、終止、反覆,以及粗細複小節線;一房子/二房子、Segno、Coda、D.C.、D.S.、To Coda,以及 Fine
小節反覆單小節反覆(%)與節奏斜線
音頭標準、X、圓圈 X、十字、菱形、三角形、方形、斜線,以及隱藏音頭
多譜表與打擊樂鋼琴與大譜表樂器(最多 7 個譜表)、打擊樂譜表與打擊樂音頭
和弦記號和弦記號與和弦圖,會辨識為可編輯的和弦,而不只是文字
演奏技巧與踏板泛音、指法、運弓、撥奏、按弦/空弦、拇指把位,以及延音踏板
文字與歌詞歌詞、排練記號與文字註記

非拉丁文字的歌詞。使用拉丁字母的語言會自動辨識。日文、韓文、中文與使用西里爾字母的語言,只要在掃描前先在轉換畫面中選擇語言即可。

提高掃描準確度的最佳做法

AI 很厲害,但它只能清楚讀取頁面上看得見的內容。養成幾個小習慣,就能大幅提升樂譜轉換的準確度。

黃金法則。如果連人都很難看清楚,AI 也會很難辨識。來源越乾淨、越清晰,轉換效果就越好。

請這樣做

  • 使用高解析度掃描,或清晰、光線充足的照片
  • 將頁面平放,端正地填滿畫面
  • 優先使用印刷版或數位排版的樂譜
  • 使用 app 內相機,系統會自動裁切並校正頁面
  • 每個檔案只匯入一首作品,獨奏分譜也請每個檔案只放一種樂器

哪些情況會影響辨識

  • 低解析度或模糊的檔案
  • 彎曲、變形或弧形的五線譜(拍攝靠近書脊的書頁時常見)
  • 顏色淡、部分被擦除,或有大量標記的樂譜記號
  • 掃描雜訊、陰影,或傾斜、旋轉的頁面

光學樂譜辨識說明

什麼是光學樂譜辨識(OMR)?

OMR 就像是文字領域中的 OCR 在音樂上的對應技術,也就是能讀取頁面上印刷樂譜記號,並將其重建為結構化、可編輯樂譜的軟體。Opuscan 使用 AI 模型辨識五線譜、音符、節奏、歌詞和力度記號,接著產生可播放、可匯出的真正樂譜。

AI 能把 PDF 樂譜轉成可編輯的樂譜嗎?

可以。Opuscan 可將印刷或數位排版的 PDF 樂譜與照片轉換為完全可編輯的樂譜,並匯出標準 MusicXML 和 MIDI,供 MuseScore、Dorico、Sibelius、Flat 與任何 DAW 使用。

用手機拍的照片也能用嗎?

可以。App 內建相機會使用裝置端的文件掃描功能,在辨識前先找出頁面、自動裁切並拉平。若想獲得最準確的結果,請參考上方的最佳做法

支援手寫樂譜或六線譜嗎?

目前還不支援。Opuscan 是為雕版或印刷的標準西洋記譜法而設計。手寫樂譜、吉他或貝斯六線譜,以及不含標準記譜法的頁面都不支援。

開發者

自動化樂譜轉換。

驅動 Opuscan 的同一套辨識能力,也提供 API 形式使用。傳送 PDF 或圖片,即可取得結構化的 MusicXML,方便儲存、呈現或編輯。

為大規模處理而打造

一個 API,搞定您的整個目錄。

  • 上傳 PDF 或圖片,下載 MusicXML 或 MIDI
  • 與 App 相同的模型,準確度毫不妥協
  • 整批處理整個目錄,無需人工介入

持續進步的
持續進步。

我們持續改進掃描功能。每次更新了什麼,都清楚列給您看。

探索 Opuscan 的使用情境