AI 光学乐谱识别

将 PDF、扫描件或照片转换为完全可编辑的乐谱。

Opuscan 的 AI 光学乐谱识别（OMR）会读取页面上印刷的音乐内容，并将其重建为真正的乐谱，让你可以播放、移调、编配，并导出为 MusicXML 或 MIDI。你提供乐谱，AI 负责录入。

印刷页面

.musicxml
.midi

可编辑乐谱

由 Tutteo 自研 AI 模型驱动

由我们自主构建、训练并持续改进的识别 AI。

每一份 PDF 和照片都会由 Tutteo 自研的内部深度学习模型处理，而不是第三方引擎。它不只是识别符号，还会像受过训练的音乐人那样，在音乐语境中理解这些符号，因此它重建出的乐谱在音乐上是真正说得通的。

结合上下文同时读取节奏、音高和版面，而不是逐个符号识别
区分不同乐器和声部，并将歌词、和弦及文字正确对应到相应的音符
从头到尾由我们内部打造，因此每次发布都能带来可衡量的提升

工作原理

导入你的乐谱在电脑上导入 PDF 或图片，或直接在 Opuscan 移动应用中拍照。
Opuscan 识读页面内容它会扫描每一页，并识别谱表、音符和各种记号。
检查、编辑并导出你的乐谱会以完全可编辑的乐谱打开。检查并修正后，你可以移调、改编、回放，或导出为 MusicXML 和 MIDI，在你常用的制谱软件中继续处理。

用手机拍摄即可。应用内相机使用设备端文档扫描，会在识别前自动找到页面、裁切并拉平图像。拍得越清晰，转换结果就越干净。

Opuscan 可以识别什么

Opuscan 的 OMR 专为采用标准西方音乐记谱法并经过排版的乐谱而打造，也就是由制谱软件排版或专业印刷的音乐。这涵盖了大多数乐谱、教材、分谱和主旋律谱。

效果良好

印刷版或数字排版的乐谱，包括印刷页面的扫描件和照片
独奏分谱、钢琴及其他大谱表乐谱，以及多乐器总谱
带和弦标记的主旋律谱

暂不支持

手写或手工誊写的乐谱
Tablature（吉他/贝斯六线谱），目前暂不支持
不含标准记谱的页面（仅文字、仅歌词、封面页）

支持哪些记谱法？

在经过排版的西方音乐记谱法范围内，Opuscan 可以识别多种记号，包括：

类别	Opuscan 可识别的内容
谱号	高音（G）谱号、低音（F）谱号，以及中音和次中音（C）谱号的所有位置，还有八度移位谱号和打击乐谱号，包括乐曲中的谱号变化
调号	所有调号，从 7 个降号到 7 个升号
拍号	任意 1 到 24 的分子；分母支持 1、2、4、8、16 和 32；另包括常用拍号和二二拍
音符时值	从全音符到 1024 分音符，另包括二全音符、长音符和大长音符，并支持附点
休止符	常规休止符和多小节休止符
连音组	三连音及其他比例形式（3:2、2:3、5:4、6:4、7:4、7:8、9:8 等）
符杠	标准连梁、局部连梁、钩形连梁、自定义连梁模式，以及跨休止符的连梁
音高与和弦	涵盖带加线的完整音高范围、和弦，以及单一谱表上的多个声部
临时记号	升号、降号、还原号、重升号/重降号、提示性临时记号，以及微分音（四分之一音）临时记号
连音线、圆滑线与倚音	连音线、圆滑线、装饰音、倚音，以及提示音符（小音符）
力度与渐强/渐弱记号	从 ppp 到 fff，以及 sf、sfz、fz、fp、rfz 等，并支持渐强和渐弱发夹线
演奏法记号	断奏、特断奏、保持音、重音、强重音、分离连奏、换气记号、休止记号，以及爵士记号
装饰音与震音	颤音、波音、回音、摇音、滑音、海顿装饰音、波浪线，以及 1 到 4 斜杠震音
线条记号与速度	八度线（8va、8vb、15ma、15mb）、带 BPM 的速度记号，以及 rit./accel.
小节线与反复记号	普通、双小节线、终止、反复和粗细小节线；反复房子、Segno、Coda、D.C.、D.S.、To Coda 和 Fine
小节反复	单小节反复（%）和节奏斜线
符头	标准、X、圆圈 X、十字、菱形、三角形、方形、斜杠和隐藏符头
多谱表与打击乐	钢琴和大谱表乐器（最多 7 个谱表）、打击乐谱表和打击乐音符头
和弦符号	和弦符号和和弦图，并识别为可编辑的和弦，而不只是文本
演奏技巧与踏板	泛音、指法、运弓、拨奏、闭弦/空弦、拇指把位，以及延音踏板
文本与歌词	歌词、排练记号和文本注释

非拉丁文字歌词。 使用拉丁字母的语言会自动识别。日语、韩语、中文和使用西里尔字母的语言，只需在扫描前先在转换界面选择语言即可。

获得准确扫描结果的最佳做法

AI 很强大，但它只能清楚读出页面上实际存在的内容。养成几个简单习惯，就能大幅提升乐谱转换的准确度。

黄金法则。 如果人眼都难以辨认，AI 同样也很难读懂。源文件越干净、越清晰，转换效果就越好。

这样做

使用高分辨率扫描，或清晰、光线充足的照片
将页面平放，摆正并尽量铺满取景框
优先使用印刷版或数字排版的乐谱
使用应用内相机，这样页面会自动裁切并拉平
每个文件只导入一首作品；如果是独奏分谱，每个文件也只保留一种乐器

影响识别效果的情况

低分辨率或模糊的文件
弯折、变形或弧形的谱表（例如拍摄靠近书脊的书页时）
浅淡、部分擦除或涂改严重的乐谱记号
扫描伪影、阴影，或页面倾斜、旋转

光学乐谱识别详解

什么是光学乐谱识别（OMR）？

OMR 可以看作是音乐领域中的 OCR: 它是一种软件，能够读取页面上印刷的乐谱记号，并将其重建为结构化、可编辑的乐谱。Opuscan 使用 AI 模型识别谱表、音符、节奏、歌词和力度标记，然后为您生成可播放、可导出的真实乐谱。

AI 能把乐谱 PDF 转换成可编辑的乐谱吗？

可以。Opuscan 可将印刷版或数字排版的乐谱 PDF 和照片转换为完全可编辑的乐谱，并导出标准 MusicXML 和 MIDI，适用于 MuseScore、Dorico、Sibelius、Flat 以及任何 DAW。

用手机拍的照片也能用吗？

可以。应用内相机会先在设备上进行文档扫描，在识别前自动找到页面、裁切并拉平页面。要获得最准确的结果，请参考上方的最佳实践。

支持手写乐谱或六线谱吗？

暂不支持。Opuscan 专为采用标准西方记谱法的排印或印刷乐谱而设计。手写乐谱、吉他或贝斯六线谱，以及不含标准记谱的页面均不受支持。

开发者

自动化处理乐谱转换。

驱动 Opuscan 的同一套识别能力也提供 API。发送 PDF 或图像，即可返回结构化的 MusicXML，方便存储、渲染或编辑。

为大规模处理而打造

一个 API，覆盖您的全部目录。

上传 PDF 或图像，下载 MusicXML 或 MIDI
与应用中使用的模型相同，准确率毫不妥协
整批处理整个目录，无需人工干预

阅读 API 文档联系我们

opuscan-omr

# Create an OMR job, then add pages to it
POST /v2/omr/jobs
Authorization: Bearer your_access_token
Content-Type: application/json

{ "output": "musicxml" }
201 Created
{
  "id": "6650f1c2a4e3b90012ab34cd",
  "status": "draft",
  "output": "musicxml"
}

识别能力
持续不断进步。

我们的扫描能力持续改进。每一次更新，一目了然。

查看 OMR 更新日志

探索 Opuscan 的使用场景