
Entonces tengo este archivo de texto gigante. Y estoy intentando eliminar todos los eventos después de las fechas.
Ejemplo
1900 Sigmund Freud published 'Interpretation of Dreams' marking the beginning of Psychoanalytic Thought.
Resultado :
1900
//El documento tiene años desde 1550 a. C. - 2015.
Respuesta1
Si el año siempre tiene 4 dígitos al comienzo de la línea, como en su ejemplo, puede capturarlo con la siguiente expresión regular:
^([0-9]{1,4}( BCE)?)