Оптическое распознавание нот на базе ИИ

Превратите PDF, скан или фото в полностью редактируемую партитуру.

Оптическое распознавание нот (OMR) на базе ИИ в Opuscan считывает музыку, напечатанную на странице, и воссоздаёт её в виде настоящей нотной записи, которую можно воспроизводить, транспонировать, аранжировать и экспортировать в MusicXML или MIDI. Вы предоставляете ноты. А ИИ делает всю работу по набору.

Печатная страница первого струнного квартета Моцарта, отсканированная с оригинальной гравюры.

Печатная страница

  • .musicxml
  • .midi
Тот же квартет, заново воссозданный Opuscan в виде чистой, полностью редактируемой партитуры.

Редактируемая партитура

Работает на собственной ИИ-модели Tutteo

ИИ для распознавания, который мы сами создаём, обучаем и улучшаем.

Каждый PDF и каждая фотография обрабатываются собственной моделью глубокого обучения Tutteo, а не сторонним движком. Она не просто распознаёт символы, а читает их в музыкальном контексте, как это сделал бы обученный музыкант, поэтому воссозданная ею партитура действительно имеет смысл.

  • Считывает ритм, высоту нот и расположение вместе, в контексте, а не символ за символом
  • Разделяет инструменты и голоса, а также привязывает слова, аккорды и текст к нужным нотам
  • Полностью создана нашей командой, поэтому с каждым релизом становится заметно лучше

Как это работает

  1. Импортируйте нотыИмпортируйте PDF или изображение на компьютере либо сделайте снимок прямо в мобильном приложении Opuscan.
  2. Opuscan считывает страницуОн сканирует каждую страницу и распознаёт нотоносцы, ноты и обозначения.
  3. Проверьте, отредактируйте и экспортируйтеВаша музыка открывается как полностью редактируемая партитура. Проверьте и исправьте всё, что нужно, затем транспонируйте, аранжируйте, воспроизводите или экспортируйте в MusicXML и MIDI для работы в вашем нотном редакторе.

Снимайте на телефон. Камера в приложении использует встроенное сканирование документов: она находит страницу, обрезает её и выпрямляет изображение перед распознаванием. Чем чище снимок, тем качественнее конвертация.

Что может считывать Opuscan

OMR в Opuscan рассчитан на стандартную западную нотацию в гравированном наборе, то есть на музыку, набранную в нотном редакторе или профессионально напечатанную. Сюда относится большая часть нотных изданий, учебных пособий, партий и мелодий с аккордами.

Работает хорошо

  • Печатные ноты или ноты, набранные в нотном редакторе, включая сканы и фотографии печатных страниц
  • Сольные партии, фортепианная и другая музыка на двух нотоносцах, а также партитуры для нескольких инструментов
  • Мелодии с буквенно-цифровыми обозначениями аккордов

Не поддерживается

  • Рукописные ноты или ноты, переписанные от руки
  • Табулатура (гитарная/бас-гитарная табулатура), которая пока не поддерживается
  • Страницы без стандартной нотации (только текст, только слова, титульные страницы)

Какие виды нотации поддерживаются?

В рамках западной нотации в гравированном наборе Opuscan распознаёт широкий набор обозначений, в том числе:

КатегорияЧто распознаёт Opuscan
КлючиСкрипичный (G), басовый (F), альтовый и теноровый (C) во всех позициях, октавные и ударные ключи, включая смену ключа внутри произведения
Знаки при ключеВсе знаки при ключе, от 7 бемолей до 7 диезов
РазмерыЛюбой числитель от 1 до 24, знаменатели 1, 2, 4, 8, 16 и 32, а также обычный и alla breve
Длительности нотОт целых до 1024-х нот, а также brevis, longa и maxima, с точками увеличения
ПаузыОбычные паузы и многотактовые паузы
Нерегулярные ритмические группыТриоли и другие соотношения (3:2, 2:3, 5:4, 6:4, 7:4, 7:8, 9:8 и другие)
БалкиСтандартные балки, частичные балки, флажки, нестандартные схемы группировки и балки через паузы
Высоты звуков и аккордыПолный звуковысотный диапазон с добавочными линейками, аккордами и несколькими голосами на одном нотоносце
Знаки альтерацииДиез, бемоль, бекар, дубль-диез/дубль-бемоль, предупредительные и микротоновые знаки альтерации (четвертьтона)
Лиги, лиги фразировки и форшлагиЛиги, лиги фразировки, форшлаги, перечёркнутые форшлаги и малые ноты
Динамика и вилкиОт ppp до fff, а также sf, sfz, fz, fp, rfz и другие обозначения, включая вилки crescendo и decrescendo
АртикуляцияСтаккато, стаккатиссимо, тенуто, акцент, маркато, portato, знаки дыхания, цезуры и джазовые обозначения
Орнаменты и тремолоТрель, мордент, группетто, pralltriller, шлейфер, украшение Гайдна, волнистая линия и тремоло с 1-4 перечеркиваниями
Линии и темпОктавные линии (8va, 8vb, 15ma, 15mb), метрономические обозначения с BPM и rit./accel.
Тактовые черты и повторыОбычные, двойные, финальные, репризные и сочетания толстых и тонких тактовых черт; вольты, Segno, Coda, D.C., D.S., To Coda и Fine
Повторы тактовПовторы такта (%) и ритмические слэши
Головки нотСтандартные, X-образные, в виде круга с X, крестообразные, ромбовидные, треугольные, квадратные, в виде косой черты и скрытые головки нот
Многостановые системы и ударныеФортепиано и инструменты с системой из двух станов (до 7 станов), нотоносцы для ударных и головки нот
Буквенно-цифровые обозначения аккордовБуквенно-цифровые обозначения аккордов и аккордовые схемы, распознаваемые как редактируемые аккорды, а не просто как текст
Исполнительские приемы и педальФлажолеты, аппликатура, штрихи смычка, пиццикато, закрытые и открытые струны, положение большого пальца и педаль сустейна
Текст и словаСлова, репетиционные метки и текстовые пометки

Тексты песен на языках с нелатинской письменностью. Языки на латинице распознаются автоматически. Для японского, корейского, китайского и языков с кириллической письменностью просто выберите язык на экране конвертации перед сканированием.

Как добиться точного сканирования

ИИ работает хорошо, но он может четко распознать только то, что видно на странице. Несколько простых привычек заметно повышают точность конвертации нот.

Главное правило. Если человеку трудно это прочитать, ИИ тоже будет трудно. Чем чище и резче исходник, тем лучше результат конвертации.

Делайте так

  • Используйте сканы в высоком разрешении или четкие, хорошо освещенные фотографии
  • Положите страницу ровно, чтобы она заполняла кадр без перекоса
  • По возможности используйте печатные ноты или ноты компьютерного набора
  • Используйте камеру в приложении, чтобы страница автоматически обрезалась и выравнивалась
  • Импортируйте по одному произведению в одном файле, а для сольных партий используйте один файл на инструмент

Что мешает распознаванию

  • Файлы с низким разрешением или размытые файлы
  • Изогнутые, деформированные или искривленные нотоносцы (например, при съемке книги у корешка)
  • Бледная, частично стертая или сильно разрисованная пометками нотная запись
  • Артефакты сканирования, тени, а также перекошенные или повернутые страницы

Как работает распознавание нот по изображению

Что такое оптическое распознавание нот (OMR)?

OMR - это музыкальный аналог OCR для текста: технология, которая считывает нотную запись с печатной страницы и преобразует ее в структурированную, редактируемую музыку. Opuscan использует модель ИИ, чтобы распознавать нотоносцы, ноты, ритм, слова и динамические обозначения, а затем создает полноценную партитуру, которую можно воспроизводить и экспортировать.

Может ли ИИ преобразовать PDF с нотами в редактируемую партитуру?

Да. Opuscan преобразует PDF и фотографии печатных нот или нот компьютерного набора в полностью редактируемые партитуры и экспортирует стандартные файлы MusicXML и MIDI, совместимые с MuseScore, Dorico, Sibelius, Flat и любыми DAW.

Это работает с фотографией, сделанной на телефон?

Да. Камера в приложении использует встроенное сканирование документов: она находит страницу, обрезает ее по краям и выравнивает перед распознаванием. Чтобы получить максимально точный результат, ознакомьтесь с рекомендациями выше.

Поддерживаются ли рукописные ноты или табулатуры?

Пока нет. Opuscan создан для стандартной западной нотации, набранной или напечатанной типографским способом. Рукописные ноты, гитарные и басовые табулатуры, а также страницы без стандартной нотации не поддерживаются.

Для разработчиков

Автоматизируйте преобразование партитур.

То же распознавание, на котором работает Opuscan, доступно через API. Отправьте PDF или изображение и получите на выходе структурированный MusicXML, готовый к хранению, рендерингу или редактированию.

Создано для масштабирования

Один API для всего вашего каталога.

  • Загрузите PDF или изображение, получите MusicXML или MIDI
  • Та же модель, что и в приложениях, без компромиссов по точности
  • Пакетная обработка целых каталогов без ручной работы

Распознавание, которое
становится еще лучше.

Мы постоянно улучшаем сканирование. Смотрите, что именно изменилось.

Узнайте, как можно использовать Opuscan