Analise o áudio (ao vivo ou gravado) para um som específico e aumente um temporizador

Analise o áudio (ao vivo ou gravado) para um som específico e aumente um temporizador

Estou procurando uma maneira de estimar quanto tempo um indivíduo específico passa digitando todos os dias. Esse indivíduo digita extremamente alto, portanto, captar o áudio das teclas digitadas não é um problema e é realmente a única maneira de poder estimar o tempo gasto digitando é por áudio, pois não tenho acesso à máquina que esse indivíduo está usando.

Gostaria de saber se existe algum tipo de solução que se aproxime do que procuro nesta situação.

Quaisquer ideias e/ou sugestões são muito apreciadas!

informação relacionada