AI-baseret optisk musikgenkendelse

Gør en PDF, scanning eller et foto til en fuldt redigerbar node.

Opuscans AI-drevne optiske musikgenkendelse (OMR) læser musikken, der er trykt på siden, og genskaber den som rigtig notation, som du kan afspille, transponere, arrangere og eksportere til MusicXML eller MIDI. Du kommer med noderne. AI'en klarer indtastningen.

En trykt side fra Mozarts første strygekvartet, scannet fra den originale gravering.

Trykt side

  • .musicxml
  • .midi
Den samme kvartet genskabt af Opuscan som en ren, fuldt redigerbar node.

Redigerbar node

Drevet af Tutteos egen AI-model

En genkendelses-AI, som vi selv bygger, træner og forbedrer.

Hver PDF og hvert foto behandles af Tutteos egen deep learning-model, ikke af en tredjepartsplatform. Den genkender ikke bare symboler, den læser dem i en musikalsk sammenhæng, sådan som en uddannet musiker ville gøre, så noderne, den genskaber, faktisk giver mening.

  • Læser rytme, tonehøjde og layout samlet, i sammenhæng, ikke symbol for symbol
  • Adskiller instrumenter og stemmer og knytter sangtekst, akkorder og anden tekst til de rigtige noder
  • Udviklet fra ende til anden af vores eget team, så den bliver målbart bedre med hver version

Sådan fungerer det

  1. Importér din musikImportér en PDF eller et billede på din computer, eller tag et foto direkte i Opuscan-mobilappen.
  2. Opuscan læser sidenDen scanner hver side og genkender nodesystemer, noder og symboler.
  3. Gennemgå, redigér og eksportérDin musik åbnes som et fuldt redigerbart partitur. Gennemgå og ret det, der skal rettes, og transponér, arrangér, afspil eller eksportér det derefter som MusicXML og MIDI til dit notationprogram.

Tag billedet med din telefon. Kameraet i appen bruger dokumentscanning på enheden, som finder siden, beskærer den og retter billedet op før genkendelsen. Et renere billede giver en renere konvertering.

Hvad Opuscan kan læse

Opuscans OMR er bygget til standard vestlig musiknotation, der er sat professionelt, det vil sige musik sat med notationsoftware eller trykt professionelt. Det dækker det meste nodemateriale, undervisningsbøger, stemmer og lead sheets.

Fungerer godt

  • Trykt eller digitalt sat nodemateriale, inklusive scanninger og fotos af trykte sider
  • Solostemmer, klavernoder og anden musik på to systemer samt partiturer for flere instrumenter
  • Lead sheets med akkordsymboler

Understøttes ikke

  • Håndskrevet eller håndkopieret musik
  • Tabulatur (guitar-/bastab), som endnu ikke er understøttet
  • Sider uden standardnotation (kun tekst, kun sangtekst, forsider)

Hvilke notationer understøttes?

Inden for professionelt sat vestlig notation genkender Opuscan et bredt udvalg af symboler, herunder:

KategoriHvad Opuscan genkender
NøglerDiskant- (G), bas- (F), alt- og tenor- (C) i alle positioner, oktavforskudte nøgler og slagtøjsnøgler, inklusive nøgleskift i et stykke
FortegnAlle toneartsfortegn, fra 7 b'er til 7 krydser
TaktarterAlle tællere fra 1 til 24, nævnere på 1, 2, 4, 8, 16 og 32 samt almindelig og alla breve
NodeværdierFra helnoder ned til 1024.-delsnoder samt brevis, longa og maxima med punkteringer
PauserAlmindelige pauser og flertaktspauser
Uregelmæssige underdelingerTrioler og andre forhold (3:2, 2:3, 5:4, 6:4, 7:4, 7:8, 9:8 og flere)
BjælkerAlmindelige bjælker, delbjælker, kroge, tilpassede bjælkemønstre og bjælker over pauser
Tonehøjder og akkorderHele toneomfanget med hjælpelinjer, akkorder og flere stemmer på én nodelinje
FortegnKryds, b-fortegn, opløsningstegn, dobbeltkryds/-b, parentesfortegn og mikrotonale fortegn (kvarttonefortegn)
Bindebuer, legatobuer og forslagBindebuer, legatobuer, forslag, acciaccatura og indsatser (små noder)
Dynamik og crescendobuerppp til fff plus sf, sfz, fz, fp, rfz med mere samt crescendo- og decrescendobuer
ArtikulationerStaccato, staccatissimo, tenuto, accenttegn, marcato, portato, åndedrætstegn, cæsurer og jazzmarkeringer
Forsiringer og tremoloerTrille, mordent, drejning, shake, schleifer, Haydn-forsiring, bølgelinje og tremoloer med 1 til 4 streger
Linjer og tempoOktavlinjer (8va, 8vb, 15ma, 15mb), metronommarkeringer med BPM og rit./accel.
Taktstreger og gentagelserAlmindelige, dobbelte, afsluttende, gentagelses- og tyk-tynd-taktstreger; 1.- og 2.-gange, Segno, Coda, D.C., D.S., To Coda og Fine
TaktgentagelserEntaktsgentagelser (%) og rytmeskråstreger
NodehovederStandard-, X-, cirkel-X-, kryds-, diamant-, trekant-, firkant-, skråstregs- og skjulte nodehoveder
Flere nodesystemer og slagtøjKlaver- og grand staff-instrumenter (op til 7 systemer), slagtøjssystemer og nodehoveder
AkkordsymbolerAkkordsymboler og akkordskemaer, genkendt som redigerbare akkorder og ikke bare som tekst
Spilleteknikker og pedalFlageoletter, fingersætninger, buestrøg, pizzicato, stoppede og åbne strenge, tommelfingerposition og højre pedal
Tekst og sangteksterSangtekster, øvemærker og tekstbemærkninger

Sangtekster på ikke-latinske sprog. Sprog med latinsk skrift genkendes automatisk. For japansk, koreansk, kinesisk og sprog med kyrillisk skrift skal du bare vælge sproget på konverteringsskærmen, før du scanner.

Gode råd til nøjagtige scanninger

AI'en er god, men den kan kun læse det, der tydeligt står på siden. Et par gode vaner gør en stor forskel for, hvor nøjagtige dine konverterede noder bliver.

Den gyldne regel. Hvis det er svært for et menneske at læse, vil det også være svært for AI'en at læse. Jo renere og skarpere din kilde er, desto bedre bliver konverteringen.

Gør dette

  • Brug scanninger i høj opløsning eller skarpe, velbelyste fotos
  • Læg siden fladt, og fyld billedrammen ud med siden, så den er lige
  • Foretræk trykte eller digitalt graverede noder
  • Brug kameraet i appen, så siden beskæres og rettes op automatisk
  • Importér ét værk pr. fil, og brug ét instrument pr. fil for solostemmer

Det, der forringer genkendelsen

  • Lavopløselige eller uskarpe filer
  • Bøjede, forvredne eller krumme nodesystemer (når man fotograferer en bog tæt på ryggen)
  • Utydelig, delvist udvisket eller kraftigt annoteret notation
  • Scanningsartefakter, skygger eller skæve og roterede sider

Optisk nodegenkendelse, forklaret

Hvad er optisk nodegenkendelse (OMR)?

OMR er musikkens svar på OCR for tekst: software, der læser den notation, som er trykt på en side, og genskaber den som struktureret, redigerbar musik. Opuscan bruger en AI-model til at genkende nodesystemer, noder, rytmer, sangtekster og dynamik og giver dig derefter et rigtigt partitur, som du kan afspille og eksportere.

Kan AI konvertere en PDF med noder til et redigerbart partitur?

Ja. Opuscan konverterer PDF'er og fotos af trykte eller graverede noder til fuldt redigerbare partiturer og eksporterer standardformaterne MusicXML og MIDI til MuseScore, Dorico, Sibelius, Flat og enhver DAW.

Virker det med et foto taget med min telefon?

Ja. Kameraet i appen bruger dokumentscanning på enheden, som finder, beskærer og retter siden ud før genkendelsen. Se de bedste metoder ovenfor for at få det mest nøjagtige resultat.

Understøttes håndskrevet musik eller tabulatur?

Ikke endnu. Opuscan er bygget til standard vestlig notation, som er graveret eller trykt. Håndskrevet musik, tabulatur til guitar og bas og sider uden standardnotation understøttes ikke.

Udviklere

Automatiser nodekonverteringer.

Den samme genkendelse, der driver Opuscan, er tilgængelig som et API. Send en PDF eller et billede, og få struktureret MusicXML tilbage, klar til at blive gemt, gengivet eller redigeret.

Bygget til at skalere

Ét API til hele dit katalog.

  • Upload en PDF eller et billede, og download MusicXML eller MIDI
  • Den samme model bag appsene, uden at gå på kompromis med nøjagtigheden
  • Batchbehandl hele kataloger, helt håndfrit

Genkendelse, der
hele tiden bliver bedre.

Vi forbedrer scanningen løbende. Se præcis, hvad der er ændret.

Udforsk, hvordan du kan bruge Opuscan