
¿Existe alguna herramienta que pueda detectar el idioma del texto de varios párrafos?
Respuesta1
Hay muchas herramientas para hacer esto, la primera que se me ocurre es la de Google: http://code.google.com/apis/ajax/playground/#language_detect
- En java hayhttp://textcat.sourceforge.net/
- en rubíhttps://github.com/peterc/whatlanguage
- En Perlhttp://search.cpan.org/~ambs/Lingua-Identify-0.29/lib/Lingua/Identify.pm etc.
Espero eso ayude
Respuesta2
La file
herramienta tiene un montón de heurísticas para adivinar tipos de archivos, incluida una que informa "texto en inglés". No sé si conoce otros lenguajes humanos, pero definitivamente podría actualizarse para adivinar entre ellos.