AI 光学乐谱识别

将 PDF、扫描件或照片转换为完全可编辑的乐谱。

Opuscan 的 AI 光学乐谱识别(OMR)会读取页面上印刷的音乐内容,并将其重建为真正的乐谱,让你可以播放、移调、编配,并导出为 MusicXML 或 MIDI。你提供乐谱,AI 负责录入。

莫扎特第一弦乐四重奏的印刷页面,扫描自原始雕版。

印刷页面

  • .musicxml
  • .midi
同一首四重奏经 Opuscan 重建为干净、完全可编辑的乐谱。

可编辑乐谱

由 Tutteo 自研 AI 模型驱动

由我们自主构建、训练并持续改进的识别 AI。

每一份 PDF 和照片都会由 Tutteo 自研的内部深度学习模型处理,而不是第三方引擎。它不只是识别符号,还会像受过训练的音乐人那样,在音乐语境中理解这些符号,因此它重建出的乐谱在音乐上是真正说得通的。

  • 结合上下文同时读取节奏、音高和版面,而不是逐个符号识别
  • 区分不同乐器和声部,并将歌词、和弦及文字正确对应到相应的音符
  • 从头到尾由我们内部打造,因此每次发布都能带来可衡量的提升

工作原理

  1. 导入你的乐谱在电脑上导入 PDF 或图片,或直接在 Opuscan 移动应用中拍照。
  2. Opuscan 识读页面内容它会扫描每一页,并识别谱表、音符和各种记号。
  3. 检查、编辑并导出你的乐谱会以完全可编辑的乐谱打开。检查并修正后,你可以移调、改编、回放,或导出为 MusicXML 和 MIDI,在你常用的制谱软件中继续处理。

用手机拍摄即可。应用内相机使用设备端文档扫描,会在识别前自动找到页面、裁切并拉平图像。拍得越清晰,转换结果就越干净。

Opuscan 可以识别什么

Opuscan 的 OMR 专为采用标准西方音乐记谱法并经过排版的乐谱而打造,也就是由制谱软件排版或专业印刷的音乐。这涵盖了大多数乐谱、教材、分谱和主旋律谱。

效果良好

  • 印刷版或数字排版的乐谱,包括印刷页面的扫描件和照片
  • 独奏分谱、钢琴及其他大谱表乐谱,以及多乐器总谱
  • 带和弦标记的主旋律谱

暂不支持

  • 手写或手工誊写的乐谱
  • Tablature(吉他/贝斯六线谱),目前暂不支持
  • 不含标准记谱的页面(仅文字、仅歌词、封面页)

支持哪些记谱法?

在经过排版的西方音乐记谱法范围内,Opuscan 可以识别多种记号,包括:

类别Opuscan 可识别的内容
谱号高音(G)谱号、低音(F)谱号,以及中音和次中音(C)谱号的所有位置,还有八度移位谱号和打击乐谱号,包括乐曲中的谱号变化
调号所有调号,从 7 个降号到 7 个升号
拍号任意 1 到 24 的分子;分母支持 1、2、4、8、16 和 32;另包括常用拍号和二二拍
音符时值从全音符到 1024 分音符,另包括二全音符、长音符和大长音符,并支持附点
休止符常规休止符和多小节休止符
连音组三连音及其他比例形式(3:2、2:3、5:4、6:4、7:4、7:8、9:8 等)
符杠标准连梁、局部连梁、钩形连梁、自定义连梁模式,以及跨休止符的连梁
音高与和弦涵盖带加线的完整音高范围、和弦,以及单一谱表上的多个声部
临时记号升号、降号、还原号、重升号/重降号、提示性临时记号,以及微分音(四分之一音)临时记号
连音线、圆滑线与倚音连音线、圆滑线、装饰音、倚音,以及提示音符(小音符)
力度与渐强/渐弱记号从 ppp 到 fff,以及 sf、sfz、fz、fp、rfz 等,并支持渐强和渐弱发夹线
演奏法记号断奏、特断奏、保持音、重音、强重音、分离连奏、换气记号、休止记号,以及爵士记号
装饰音与震音颤音、波音、回音、摇音、滑音、海顿装饰音、波浪线,以及 1 到 4 斜杠震音
线条记号与速度八度线(8va、8vb、15ma、15mb)、带 BPM 的速度记号,以及 rit./accel.
小节线与反复记号普通、双小节线、终止、反复和粗细小节线;反复房子、Segno、Coda、D.C.、D.S.、To Coda 和 Fine
小节反复单小节反复(%)和节奏斜线
符头标准、X、圆圈 X、十字、菱形、三角形、方形、斜杠和隐藏符头
多谱表与打击乐钢琴和大谱表乐器(最多 7 个谱表)、打击乐谱表和打击乐音符头
和弦符号和弦符号和和弦图,并识别为可编辑的和弦,而不只是文本
演奏技巧与踏板泛音、指法、运弓、拨奏、闭弦/空弦、拇指把位,以及延音踏板
文本与歌词歌词、排练记号和文本注释

非拉丁文字歌词。 使用拉丁字母的语言会自动识别。日语、韩语、中文和使用西里尔字母的语言,只需在扫描前先在转换界面选择语言即可。

获得准确扫描结果的最佳做法

AI 很强大,但它只能清楚读出页面上实际存在的内容。养成几个简单习惯,就能大幅提升乐谱转换的准确度。

黄金法则。 如果人眼都难以辨认,AI 同样也很难读懂。源文件越干净、越清晰,转换效果就越好。

这样做

  • 使用高分辨率扫描,或清晰、光线充足的照片
  • 将页面平放,摆正并尽量铺满取景框
  • 优先使用印刷版或数字排版的乐谱
  • 使用应用内相机,这样页面会自动裁切并拉平
  • 每个文件只导入一首作品;如果是独奏分谱,每个文件也只保留一种乐器

影响识别效果的情况

  • 低分辨率或模糊的文件
  • 弯折、变形或弧形的谱表(例如拍摄靠近书脊的书页时)
  • 浅淡、部分擦除或涂改严重的乐谱记号
  • 扫描伪影、阴影,或页面倾斜、旋转

光学乐谱识别详解

什么是光学乐谱识别(OMR)?

OMR 可以看作是音乐领域中的 OCR: 它是一种软件,能够读取页面上印刷的乐谱记号,并将其重建为结构化、可编辑的乐谱。Opuscan 使用 AI 模型识别谱表、音符、节奏、歌词和力度标记,然后为您生成可播放、可导出的真实乐谱。

AI 能把乐谱 PDF 转换成可编辑的乐谱吗?

可以。Opuscan 可将印刷版或数字排版的乐谱 PDF 和照片转换为完全可编辑的乐谱,并导出标准 MusicXML 和 MIDI,适用于 MuseScore、Dorico、Sibelius、Flat 以及任何 DAW。

用手机拍的照片也能用吗?

可以。应用内相机会先在设备上进行文档扫描,在识别前自动找到页面、裁切并拉平页面。要获得最准确的结果,请参考上方的最佳实践

支持手写乐谱或六线谱吗?

暂不支持。Opuscan 专为采用标准西方记谱法的排印或印刷乐谱而设计。手写乐谱、吉他或贝斯六线谱,以及不含标准记谱的页面均不受支持。

开发者

自动化处理乐谱转换。

驱动 Opuscan 的同一套识别能力也提供 API。发送 PDF 或图像,即可返回结构化的 MusicXML,方便存储、渲染或编辑。

为大规模处理而打造

一个 API,覆盖您的全部目录。

  • 上传 PDF 或图像,下载 MusicXML 或 MIDI
  • 与应用中使用的模型相同,准确率毫不妥协
  • 整批处理整个目录,无需人工干预

识别能力
持续不断进步。

我们的扫描能力持续改进。每一次更新,一目了然。

探索 Opuscan 的使用场景