
Existe uma ferramenta que detecte o idioma do texto de vários parágrafos?
Responder1
existem muitas ferramentas para fazer isso, a primeira que consigo pensar é a do Google: http://code.google.com/apis/ajax/playground/#language_detect
- Em java, existehttp://textcat.sourceforge.net/
- Em rubihttps://github.com/peterc/whatlanguage
- Em Perlhttp://search.cpan.org/~ambs/Lingua-Identify-0.29/lib/Lingua/Identify.pm etc.
Espero que ajude
Responder2
A file
ferramenta possui várias heurísticas para adivinhar os tipos de arquivos, incluindo uma que informa "texto em inglês". Não sei se conhece outras línguas humanas, mas definitivamente poderia ser atualizado para adivinhar entre elas.