와온이란 무엇인가?

와온이란 무엇인가?

작성하고 싶은 프로그램에 대한 아이디어가 있지만 음악 오디오(첫 번째 근사치에서는 단일 기타)를 음표(예: 음악에 대한 OCR/음성 인식)로 변환하는 방법이 필요합니다.

구글이 찾았다IntelliScore, 그러나 그것이 나에게 필요한 것보다 더 많은 기능(여러 가지 도구)을 광고하고 있지만 그것은 독점적이며 무료이고 GPL과 호환되는 것을 찾고 있습니다.

이를 수행할 수 있는 무료/GPL 프로그램이나 라이브러리가 있습니까?

답변1

있다노티. 메모를 감지하여 화면에 기록할 수 있습니다. 이는 GPL이므로 감지/변환 루틴을 추출하고 조정할 수 있어야 합니다.

여기에 이미지 설명을 입력하세요

또 다른 옵션은음악 서사 키트어느:

음악 오디오 파일을 일반적인 음악 표기법으로 변환하기 위한 툴킷입니다. 이는 스펙트로그램이나 이와 유사한 것에 수동으로 주석을 달고 이를 MIDI 파일 및 abc 음악 표기법 파일로 변환하여 수행됩니다.

독점 프로그램 Transcribe! 가지고있다광범위한 목록오픈 소스인 일부 도구를 포함한 기타 음악 녹음 도구. 당신은 또한 확인할 수 있습니다소스포지다른 오픈 소스 음악 전사 프로그램의 경우.

답변2

Google이 권장합니다 waon.

원래 켜져 있음http://waon.sourceforge.net/gtk 기반 GUI를 포함하여 Xubuntu 18.04에서 컴파일했습니다.

와온이란 무엇인가?

WaoN은 Wave-to-Notes 전사기, 즉 Tuukka Toivonen(및 그 후손 timidity++)의 timidity와 반대입니다. (...) 원래 의도는 제가 가장 좋아하는 피아니스트의 소리에서 조화로운 보이싱을 추출하는 것입니다. (...)

현재 WaoN에는 세 가지 프로그램이 포함되어 있습니다.

waon: transcriber (wav-to-mid converter)
pv: phase vocoder for time-streching and pitch-shifting
gwaon: GUI for waon and pv

WaoN은 GNU General Public License에 따라 배포됩니다.

소스 코드를 찾을 수 있는 곳

CVS는 오래되었고 sourceforge는 단계적으로 폐지됩니다. CVS 기반 기록을 git으로 변환하고 다시 호스팅했습니다.https://github.com/fidergo-stephane-gourichon/waon.

어떤 옵션이 있나요?

다음은 실행 파일이 제공하는 옵션 요약입니다.

 ./waon --help

WaoN - a Wave-to-Notes transcriber, Version 0.10

Copyright (C) 1998-2007 Kengo Ichiki <[email protected]>
Web: http://waon.sourceforge.net/

WaoN is a Wave-to-Notes transcriber,
that is, a converter from sound file to midi file.

Usage: ./waon [option ...]

Options:
  -h --help print this help.
  -v, --version print version information.
OPTIONS FOR FILES
  -i --input    input wav file (default: stdin)
  -o --output   output mid file (default: 'output.mid')
    options -i and -o have argument '-' as stdin/stdout
  -p --patch    patch file (default: no patch)
FFT OPTIONS
  -n        sampling number from WAV in 1 step (default: 2048)
  -w --window   0 no window
        1 parzen window
        2 welch window
        3 hanning window (default)
        4 hamming window
        5 blackman window
        6 steeper 30-dB/octave rolloff window
READING WAV OPTIONS
  -s --shift    shift number from WAV in 1 step
        (default: 1/4 of the value in -n option)
PHASE-VOCODER OPTIONS
  -nophase  don't use phase diff to improve freq estimation.
        (default: use the correction)
NOTE SELECTION OPTIONS
  -c --cutoff   log10 of cut-off ratio to scale velocity of note
        (default: -5.0)
  -r --relative log10 of cut-off ratio relative to the average.
        (default: no relative cutoff
        = absolute cutoff with the value in -c option)
  -k --peak peak threshold for note-on, which ranges [0,127]
        (default: 128 = no peak-search = search only first on-event)
  -t --top  top note [midi #] (default: 103 = G7)
  -b --bottom   bottom note [midi #] (default: 28 = E1)
    Here middle C (261 Hz) = C4 = midi 60. Midi # ranges [0,127].
  -a --adjust   adjust-pitch param, which is suggested by WaoN after analysis.
        unit is half-note, that is, +1 is half-note up,
        and -0.5 is quater-note down. (default: 0)
DRUM-REMOVAL OPTIONS
  -psub-n   number of averaging bins in one side.
        that is, for n, (i-n,...,i,...,i+n) are averaged
        (default: 0)
  -psub-f   factor to the average, where the power is modified as
        p[i] = (sqrt(p[i]) - f * sqrt(ave[i]))^2
        (default: 0.0)
OCTAVE-REMOVAL OPTIONS
  -oct  factor to the octave removal, where the power is modified as
        p[i] = (sqrt(p[i]) - f * sqrt(oct[i]))^2
        (default: 0.0)

답변3

소프트웨어 솔루션을 제공할 수는 없지만 근본적인 문제, 즉 임의의 소스에서 "자연스러운" 톤을 인식하는 문제를 해결할 수는 있습니다. 퍼즐에서 누락된 조각은 스펙트로그램의 위상 부분을 효과적으로 활용하는 것입니다.재할당스펙트럼의 주파수를 보다 자연스러운 위치로 변환합니다(스펙트럼의 "순간 주파수"). 그 결과 스펙트럼이 처프 라인에 더 집중됩니다. 유사한 고려 사항이 스케일로그램에도 적용됩니다. 스케일로그램은 선형 스케일이 아닌 주파수에 대한 로그 스케일을 사용한다는 점에서 스펙트로그램과 다릅니다.

Loris 패키지는 순간 주파수를 추정하는 루틴을 포함하는 일련의 루틴을 제공하는 것으로 알고 있는 패키지 중 하나입니다.

자신만의 소프트웨어를 작성하고 있으므로 스펙트로그램이나 스케일로그램에 대한 재할당 방법을 직접 구현하고 이를 분석의 중간 단계로 사용할 수 있습니다. 한 가지 가능성은 이 데모 비디오의 설명 부분에서 제공한 공식을 실험해 보는 것입니다. 재할당의 스케일러그래픽 아날로그를 수행하는 "동기화"라는 웨이블릿 기반 스케일로그램에 맞게 특별히 조정된 방법이 있습니다.

내가 나열하는 공식은 훨씬 간단하고 유사한 분석을 더 직접적으로 수행하며 스케일로그램의 개별 구성 요소도 진정한 사운드 구성 요소(위상도 있으므로)이므로 전체 사운드가 실제로 컴포넌트 사운드의 합입니다. 즉, "역" 변환(스케일로그램에서 사운드로)은 단순한 추가에 불과합니다.

https://www.youtube.com/watch?v=OugT7uGGtNg

관련 정보