¿Se pueden utilizar expresiones regulares en las URL mientras se navega?

¿Se pueden utilizar expresiones regulares en las URL mientras se navega?

Estoy consciente deidiotas de googleque utilizan operadores avanzados para buscar palabras clave en la Web, y Google Dorks no es Regex de todos modos.

Por curiosidad, intenté poner caracteres comodín en las URL, principalmente para imágenes de varios sitios, pero no funcionó. La mayoría de ellos mostraban varios códigos de error HTTP, con excepción de 2 o 3 que redirigían a alguna otra página dentro del sitio web.

Algunos ejemplos que no funcionaron:

  • Buscando archivos PDF. Consiguió404 : Page Not Found

Búsqueda de archivos PDF

  • Buscando imágenes. Consiguió500 : Internal Server Error

Búsqueda de expresiones regulares de imagen

  • Buscando todas las páginas HTML en el sitio web. Simplemente página de error

Búsqueda de páginas HTML

  • Youtube convierte caracteres a caracteres hexadecimales seguros.

Búsqueda de Youtube

Un ejemplo que funcionó (no tengo idea de cómo):

Preguntas etiquetadas de Windows

Preguntas etiquetadas sobre Linux

Ver elQuestion Taggedsección a la derecha de la página para ver todas las búsquedas de la palabralin*

Pido disculpas si la pregunta tiene demasiados detalles, pero me parece apropiado dar algunos ejemplos. Entonces aquí concluyo mi pregunta:

  1. ¿Se pueden utilizar expresiones regulares de alguna manera en las URL mientras se navega?

  2. En caso afirmativo, ¿cuáles son las reglas o métodos para utilizarlos?

  3. También,Sección de usosen la página de Wikipedia para expresiones regulares, cite esto:

    Si bien las expresiones regulares serían útiles en los motores de búsqueda de Internet, procesarlas en toda la base de datos podría consumir recursos informáticos excesivos dependiendo de la complejidad y el diseño de la expresión regular. Aunque en muchos casos los administradores de sistemas pueden ejecutar consultas basadas en expresiones regulares internamente, la mayoría de los motores de búsqueda no ofrecen soporte para expresiones regulares al público. Excepciones notables: Google Code Search, Exalead. Google Code Search se cerró en enero de 2012.[39] Utilizó un índice de trigramas para acelerar las consultas.[40]

    Entonces, ¿es posible realizar búsquedas con expresiones regulares en motores de búsqueda pero no en páginas web?

Respuesta1

Generalmente no.(Además, los comodines y las expresiones regulares no son lo mismo).

Cada sitio web decide completamente sobre suposeer cómo se debe interpretar la ruta y la consulta. Las rutas pueden corresponder a archivos reales o pueden asignarse a recursos abstractos como "preguntas" o "publicaciones". (por ejemplo, SuperUser en realidad no tiene una carpeta llamada questionsllena de subcarpetas numeradas; la ruta simplemente le indica qué respuesta generar).

Esto también significa que cada sitio web decide si admitirá comodines (o expresiones regulares o cualquier otro método de filtrado) o no. Por lo general, agregar esta función requeriría programación adicional en el sitio web.

Como descubrió, Superusuario implementó comodines para la exploración de etiquetas; es útil para encontrar todas las preguntas relacionadas con Windows (y probablemente fue más fácil de implementar que las etiquetas jerárquicas).

Pero, por ejemplo, los ID de vídeos de YouTube son completamente aleatorios, por lo que no sirve de nada intentar enumerar todos los vídeos cuyos ID comienzan con RgK...o con cualquier otro prefijo. Entonces YouTube no implementó eso.

Servidores web "simples", que sólo sirven archivos .html normales,podríaimplementar esta característica ya que a menudo ya tienen listados automáticos de directorios. Sin embargo, muchos propietarios de sitios web no querrían esto; por ejemplo, podrían tener páginas "no listadas" que sólo son conocidas por unas pocas personas.

(Existe una característica similar en Apache httpd, que le permite obtener una lista completa del directorioincluso siHay un archivo index.html presente. Pero tiene que estar deshabilitado de forma predeterminada, porque muchas personas realmente confían en index.html como un método confiable para deshabilitar esos listados).

información relacionada