AI光学式楽譜認識

PDF、スキャン、写真を完全に編集可能な譜面に変換。

OpuscanのAI搭載光学式楽譜認識（OMR）は、ページに印刷された音楽を読み取り、再生、移調、編曲ができ、MusicXMLやMIDIに書き出せる本物の楽譜として再構成します。必要なのは楽譜だけ。入力作業はAIに任せられます。

印刷されたページ

.musicxml
.midi

編集可能な譜面

Tutteo独自のAIモデルを搭載

私たち自身で開発し、学習させ、改良を重ねる認識AI。

すべてのPDFと写真は、外部のエンジンではなく、Tutteo独自の社内開発ディープラーニングモデルで処理されます。このモデルは記号を個別に見つけるだけでなく、訓練を積んだ音楽家のように音楽的な文脈の中で読み取るため、再構築される楽譜がきちんと意味を成すものになります。

リズム、音高、レイアウトを、記号ごとではなく文脈の中でまとめて読み取ります
楽器や声部を分け、歌詞、コード、テキストを正しい音符に対応づけます
開発のすべてを自社で一貫して行っているため、リリースのたびに着実な向上を実現します

使い方

楽譜を取り込むパソコン上のPDFや画像を取り込むか、Opuscanモバイルアプリでその場で写真を撮影できます。
Opuscanがページを読み取る各ページをスキャンし、五線、音符、記号を認識します。
確認して、修正して、書き出す楽譜は完全に編集可能な状態で開きます。内容を確認して必要な箇所を修正したら、移調したり、再生したり、MusicXMLやMIDIとして書き出してお使いの楽譜作成ソフトに渡せます。

スマートフォンで取り込み。 アプリ内カメラは、認識前にページを検出し、切り抜き、画像のゆがみを補正するデバイス上の書類スキャンを使用します。きれいに取り込めるほど、変換結果もきれいになります。

Opuscanが読み取れるもの

OpuscanのOMRは、標準的な西洋音楽の浄書譜向けに設計されています。つまり、楽譜作成ソフトで組まれた譜面や、専門的に印刷された楽譜です。これには、一般的な楽譜、教則本、パート譜、リードシートの大半が含まれます。

適しています

印刷された楽譜やデジタル浄書された楽譜。印刷ページのスキャンや写真も含まれます
独奏パート譜、ピアノなどの大譜表の楽譜、複数楽器のスコア
コード記号付きのリードシート

対応していません

手書きの楽譜、または手で書き写した楽譜
タブ譜（ギター／ベースのタブ）は、まだ対応していません
標準的な記譜がないページ（テキストのみ、歌詞のみ、表紙など）

どの記譜に対応していますか？

西洋音楽の浄書譜の範囲では、Opuscanは次のような幅広い記号を認識します。

カテゴリ	Opuscanが認識するもの
音部記号	ト音記号（G）、ヘ音記号（F）、ハ音記号のアルトとテナーの各位置、オクターブ移高付き音部記号、打楽器用音部記号。曲中での音部記号の変更も含みます
調号	変7つから嬰7つまで、すべての調号
拍子記号	分子は1から24まで、分母は1、2、4、8、16、32に対応。さらに4/4のコモンタイムと2/2のアラブレーヴにも対応します
音価	全音符から1024分音符までに加え、倍全音符、ロンガ、マキシマ、および付点
休符	通常の休符と複数小節休符
連符	3連符のほか、各種の比率の連符（3:2、2:3、5:4、6:4、7:4、7:8、9:8 など）
連桁	通常の連桁、片連桁、フック、カスタムの連桁パターン、休符をまたぐ連桁
音高と和音	加線を含む全音域、和音、1段の譜表上の複数声部
臨時記号	シャープ、フラット、ナチュラル、ダブルシャープ／ダブルフラット、念のための臨時記号、微分音（四分音）の臨時記号
タイ、スラー、装飾音符	タイ、スラー、装飾音符、アッチャカトゥーラ、キュー音符（小音符）
強弱記号とヘアピン	pppからfffに加え、sf、sfz、fz、fp、rfzなどに対応。クレッシェンドとデクレッシェンドのヘアピンも認識します
アーティキュレーション	スタッカート、スタッカティッシモ、テヌート、アクセント、マルカート、デタッシェド・レガート、ブレス記号、カエスーラ、ジャズ記号
装飾音とトレモロ	トリル、モルデント、ターン、シェイク、シュライファー、ハイドン装飾、波線、1本から4本線のトレモロ
各種線とテンポ	オクターブ線（8va、8vb、15ma、15mb）、BPM付きメトロノーム記号、rit.／accel.
小節線と反復記号	通常、小節二重線、終止線、反復小節線、太細の小節線、1番・2番括弧、Segno、Coda、D.C.、D.S.、To Coda、Fine
小節反復	1小節反復（%）とリズムスラッシュ
符頭	標準、X、丸囲みX、クロス、ひし形、三角、四角、スラッシュ、非表示の符頭
多段譜表とパーカッション	ピアノなどの大譜表を使う楽器（最大7段の譜表）、打楽器譜表とその符頭
コード記号	コード記号やコード譜を、単なるテキストではなく編集可能なコードとして認識
奏法とペダル	ハーモニクス、運指、ボウイング、ピチカート、ストップ奏法／開放弦、サムポジション、サステインペダル
テキストと歌詞	歌詞、リハーサルマーク、テキスト注釈

ラテン文字以外の言語の歌詞にも対応。 ラテン文字を使う言語は自動で認識されます。日本語、韓国語、中国語、キリル文字を使う言語の場合は、スキャン前に変換画面で言語を選択するだけです。

正確にスキャンするためのベストプラクティス

AIの性能は高くても、ページ上で明確に読み取れるものしか認識できません。いくつかのポイントを押さえるだけで、変換後の楽譜の精度は大きく変わります。

いちばん大切なルール。 人が読みにくいものは、AIにとっても読みにくくなります。元の譜面がきれいで鮮明なほど、変換結果も良くなります。

認識精度を下げる要因

低解像度またはぼやけたファイル
反ったりゆがんだり、曲線状になった五線譜（本のノド付近を撮影した場合など）
かすれていたり、一部が消えていたり、書き込みが多い記譜
スキャン時のノイズ、影、傾きや回転のあるページ

光学式楽譜認識（OMR）とは

光学式楽譜認識（OMR）とは何ですか？

OMRは、テキストに対するOCRに相当する楽譜向けの技術です。ページに印刷された記譜をソフトウェアが読み取り、構造化された編集可能な楽譜として再構築します。OpuscanはAIモデルを使って五線、音符、リズム、歌詞、強弱記号を認識し、その結果を再生や書き出しができる本物の楽譜として生成します。

AIで楽譜PDFを編集可能なスコアに変換できますか？

はい。Opuscanは、印刷または浄書された楽譜のPDFや写真を、完全に編集可能なスコアへ変換し、MuseScore、Dorico、Sibelius、Flat、その他のDAWで使える標準のMusicXMLとMIDIを書き出します。

スマートフォンで撮った写真でも使えますか？

はい。アプリ内カメラでは、端末上の書類スキャン機能により、認識前にページを検出し、切り抜いて、ゆがみを補正します。より正確な結果を得るには、上のベストプラクティスをご覧ください。

手書きの楽譜やタブ譜にも対応していますか？

まだ対応していません。Opuscanは、浄書または印刷された標準的な西洋音楽の記譜を対象に設計されています。手書きの楽譜、ギターやベースのタブ譜、標準的な記譜がないページには対応していません。

開発者向け

楽譜変換を自動化。

Opuscanを支えるのと同じ認識技術を、APIとして利用できます。PDFや画像を送信すると、保存、レンダリング、編集に使える構造化されたMusicXMLが返ります。

大規模運用に対応

ひとつのAPIで、カタログ全体を。

PDFや画像をアップロードして、MusicXMLまたはMIDIをダウンロード
アプリを支えるのと同じモデルを使用。精度の妥協はありません
カタログ全体をまとめて自動処理。

APIドキュメントを見るお問い合わせ

opuscan-omr

# Create an OMR job, then add pages to it
POST /v2/omr/jobs
Authorization: Bearer your_access_token
Content-Type: application/json

{ "output": "musicxml" }
201 Created
{
  "id": "6650f1c2a4e3b90012ab34cd",
  "status": "draft",
  "output": "musicxml"
}

使うたびに進化する
認識技術。

スキャン性能は継続的に改善されています。何が変わったのかを具体的にご確認いただけます。

OMR変更履歴を見る

Opuscanの活用例を見る