Analice el audio (en vivo o grabado) para un sonido específico e incremente un temporizador

Analice el audio (en vivo o grabado) para un sonido específico e incremente un temporizador

Estoy buscando una manera de estimar la cantidad de tiempo que una persona específica pasa escribiendo todos los días. Esta persona escribe en un volumen extremadamente alto, por lo que captar el audio de las pulsaciones del teclado no es un problema y es realmente la única forma en que podré estimar. La cantidad de tiempo que dedico a escribir es a través del audio, ya que no tengo acceso a la máquina que usa esta persona.

Me pregunto si existe algún tipo de solución que se acerque a lo que busco en esta situación.

¡Cualquier idea y/o sugerencia será muy apreciada!

información relacionada