KI-gestützte optische Musikerkennung

Verwandeln Sie ein PDF, einen Scan oder ein Foto in eine vollständig bearbeitbare Partitur.

Die KI-gestützte optische Musikerkennung (OMR) von Opuscan liest die auf der Seite gedruckte Musik und baut sie als echte Notation neu auf, die Sie abspielen, transponieren, arrangieren und als MusicXML oder MIDI exportieren können. Sie bringen die Noten mit. Die KI übernimmt das Abtippen.

Eine gedruckte Seite aus Mozarts erstem Streichquartett, eingescannt aus dem Originalstich.

Gedruckte Seite

  • .musicxml
  • .midi
Dasselbe Quartett, von Opuscan als saubere, vollständig bearbeitbare Partitur neu erstellt.

Bearbeitbare Partitur

Angetrieben von Tutteos eigenem KI-Modell

Eine Erkennungs-KI, die wir selbst entwickeln, trainieren und verbessern.

„Jede PDF-Datei und jedes Foto wird von Tutteos eigenem Inhouse-Deep-Learning-Modell verarbeitet, nicht von einer Engine eines Drittanbieters. Es erkennt nicht nur Symbole, sondern liest sie im musikalischen Kontext, so wie es ein geschulter Musiker tun würde, sodass die rekonstruierte Notenausgabe tatsächlich Sinn ergibt.“

  • Erfasst Rhythmus, Tonhöhe und Layout gemeinsam im Kontext statt Symbol für Symbol
  • Trennt Instrumente und Stimmen und ordnet Liedtext, Akkorde und Text den richtigen Noten zu
  • „Durchgängig inhouse entwickelt, sodass es mit jedem Release messbar besser wird“

So funktioniert es

  1. Importieren Sie Ihre MusikImportieren Sie eine PDF-Datei oder ein Bild auf Ihrem Computer oder machen Sie direkt in der Opuscan Mobile-App ein Foto.
  2. Opuscan liest die SeiteEs scannt jede Seite und erkennt Notensysteme, Noten und Symbole.
  3. Prüfen, bearbeiten und exportieren„Ihre Musik wird als vollständig bearbeitbare Partitur geöffnet. Prüfen und korrigieren Sie alles nach Bedarf und transponieren, arrangieren, spielen Sie sie ab oder exportieren Sie sie dann als MusicXML und MIDI für Ihr Notationsprogramm.“

Mit dem Smartphone erfassen. Die In-App-Kamera nutzt Dokumentenscannen direkt auf dem Gerät: Sie erkennt die Seite, schneidet sie zu und begradigt das Bild vor der Erkennung. Eine sauberere Aufnahme bedeutet eine sauberere Umwandlung.“

Was Opuscan lesen kann

„Opuscans OMR ist für gedruckte westliche Standardnotation ausgelegt, also für Musik, die mit Notationssoftware gesetzt oder professionell gedruckt wurde. Das umfasst die meisten Noten, Instrumentalschulen, Stimmen und Lead Sheets.“

Funktioniert gut

  • Gedruckte oder digital gesetzte Noten, einschließlich Scans und Fotos gedruckter Seiten
  • „Solostimmen, Klaviermusik und andere Noten für großes System sowie Partituren für mehrere Instrumente“
  • Lead Sheets mit Akkordsymbolen

Nicht unterstützt

  • Handschriftliche oder von Hand kopierte Musik
  • Tabulatur (Gitarren-/Bass-Tab), die derzeit noch nicht unterstützt wird
  • Seiten ohne Standardnotation (nur Text, nur Liedtext, Titelseiten)

Welche Notationsarten werden unterstützt?

„Innerhalb der gedruckten westlichen Notation erkennt Opuscan eine große Bandbreite an Symbolen, darunter:“

KategorieWas Opuscan erkennt
SchlüsselViolinschlüssel (G), Bassschlüssel (F), Alt- und Tenorschlüssel (C) in allen Lagen, oktavierte und Schlagzeugschlüssel sowie Schlüsselwechsel innerhalb eines Stücks
„Vorzeichen“„Alle Vorzeichnungen, von 7 b bis 7 Kreuzen“
TaktartenJeder Zähler von 1 bis 24, Nenner von 1, 2, 4, 8, 16 und 32 sowie C und Alla breve
NotenwerteVon der Ganzen bis zur 1024stel-Note, außerdem Brevis, Longa und Maxima, jeweils mit Punktierung
PausenNormale Pausen und Mehrtaktpausen
TupletsTriolen und andere Verhältnisse (3:2, 2:3, 5:4, 6:4, 7:4, 7:8, 9:8 und weitere)
BalkenStandardbalken, Teilbalken, Fähnchen, benutzerdefinierte Balkungsformen und Balken über Pausen hinweg
Tonhöhen & AkkordeDer gesamte Tonumfang mit Hilfslinien, Akkorden und mehreren Stimmen auf einem einzigen Notensystem
VorzeichenKreuz, Be, Auflösungszeichen, Doppelkreuz und Doppel-Be, Warnvorzeichen und mikrotonale Vorzeichen (Vierteltonvorzeichen)
Haltebögen, Legatobögen & VorschlagsnotenHaltebögen, Legatobögen, Vorschlagsnoten, Acciaccatura und Stichnoten (kleine Noten)
Dynamik & GabelnVon ppp bis fff plus sf, sfz, fz, fp, rfz und mehr, mit Crescendo- und Decrescendo-Gabeln
ArtikulationenStaccato, Staccatissimo, Tenuto, Akzent, Marcato, Portato, Atemzeichen, Zäsuren und Jazz-Zeichen
Verzierungen & TremoliTriller, Mordent, Doppelschlag, Pralltriller, Schleifer, Haydn-Verzierung, Wellenlinie und Tremoli mit 1 bis 4 Schrägstrichen
Linien & TempoOktavlinien (8va, 8vb, 15ma, 15mb), Metronomangaben mit BPM und rit./accel.
Taktstriche & WiederholungenNormale, doppelte, Schluss-, Wiederholungs- und dick-dünne Taktstriche; Volten, Segno, Coda, D.C., D.S., To Coda und Fine
TaktwiederholungenEintaktwiederholungen (%) und Rhythmus-Slashes
NotenköpfeStandard-, X-, Kreis-X-, Kreuz-, Rauten-, Dreiecks-, Quadrat-, Schrägstrich- und unsichtbare Notenköpfe
Mehrere Notensysteme & SchlagzeugKlavier- und andere Instrumente mit Systemklammer bzw. mehreren Notensystemen (bis zu 7), Schlagzeugsysteme und Schlagzeug-Notenköpfe
AkkordsymboleAkkordsymbole und Chord Charts, erkannt als bearbeitbare Akkorde, nicht nur als Text
Spieltechniken & PedalFlageoletts, Fingersätze, Bogenführung, Pizzicato, gegriffene und leere Saiten, Daumenlage und Haltepedal
Text & LiedtexteLiedtexte, Probebuchstaben und Textanmerkungen

Liedtexte in nichtlateinischen Sprachen. Sprachen mit lateinischer Schrift werden automatisch erkannt. Für Japanisch, Koreanisch, Chinesisch und Sprachen mit kyrillischer Schrift wählen Sie einfach vor dem Scannen im Konvertierungsbildschirm die Sprache aus.

Bewährte Methoden für präzise Scans

Die KI ist gut, aber sie kann nur klar lesen, was auf der Seite zu sehen ist. Schon ein paar einfache Regeln machen einen großen Unterschied für die Genauigkeit Ihrer konvertierten Noten.

Die goldene Regel. Wenn es für einen Menschen schwer zu lesen ist, wird es auch für die KI schwer zu lesen sein. Je sauberer und schärfer Ihre Vorlage ist, desto besser ist die Konvertierung.

Darauf sollten Sie achten

  • Verwenden Sie hochauflösende Scans oder scharfe, gut ausgeleuchtete Fotos
  • Legen Sie die Seite flach hin, gerade und formatfüllend
  • Bevorzugen Sie gedruckte oder digital gesetzte Noten
  • Verwenden Sie die In-App-Kamera, damit die Seite automatisch zugeschnitten und entzerrt wird
  • Importieren Sie pro Datei nur ein Stück, bei Solostimmen außerdem nur ein Instrument pro Datei

Was die Erkennung beeinträchtigt

  • Dateien mit niedriger Auflösung oder unscharfe Dateien
  • Gebogene, verzerrte oder gekrümmte Notensysteme (beim Fotografieren eines Buchs nahe dem Bund)
  • Blasse, teilweise ausradierte oder stark markierte Notation
  • Scan-Artefakte, Schatten oder schief ausgerichtete und gedrehte Seiten

Optische Musikerkennung, einfach erklärt

Was ist die optische Musikerkennung (OMR)?

OMR ist das musikalische Gegenstück zu OCR für Text: Software, die die auf einer Seite gedruckte Notation liest und als strukturierte, bearbeitbare Musik neu erstellt. Opuscan nutzt ein KI-Modell, um Notensysteme, Noten, Rhythmen, Liedtexte und Dynamikangaben zu erkennen, und liefert Ihnen dann eine echte Partitur, die Sie abspielen und exportieren können.

Kann eine KI ein PDF mit Noten in eine bearbeitbare Partitur umwandeln?

Ja. Opuscan konvertiert PDFs und Fotos von gedruckten oder gestochenen Noten in vollständig bearbeitbare Partituren und exportiert MusicXML und MIDI in Standardformaten für MuseScore, Dorico, Sibelius, Flat und jede DAW.

Funktioniert es mit einem Foto, das ich mit meinem Smartphone aufgenommen habe?

Ja. Die Kamera in der App nutzt die Dokumenterfassung direkt auf dem Gerät, um die Seite vor der Erkennung zu finden, zuzuschneiden und zu entzerren. Das genaueste Ergebnis erzielen Sie, wenn Sie die bewährten Vorgehensweisen oben beachten.

Wird handgeschriebene Musik oder Tabulatur unterstützt?

Noch nicht. Opuscan ist für die westliche Standardnotation ausgelegt, die gestochen oder gedruckt wurde. Handschriftliche Musik, Gitarren- oder Bass-Tabulatur und Seiten ohne Standardnotation werden nicht unterstützt.

Entwickler

Partiturkonvertierungen automatisieren.

Dieselbe Erkennung, die auch Opuscan zugrunde liegt, ist als API verfügbar. Senden Sie ein PDF oder Bild und erhalten Sie strukturiertes MusicXML zurück, bereit zum Speichern, Rendern oder Bearbeiten.

Für Skalierbarkeit entwickelt

Eine API für Ihren gesamten Katalog.

  • PDF oder Bild hochladen, MusicXML oder MIDI herunterladen
  • Dasselbe Modell wie in den Apps, ohne Kompromisse bei der Genauigkeit
  • Ganze Kataloge im Batch verarbeiten, ohne manuelles Eingreifen

Erkennung, die
immer besser wird.

Wir verbessern das Scannen kontinuierlich. Sehen Sie genau, was sich geändert hat.

Entdecken Sie die Anwendungsfälle von Opuscan