
Estoy consciente deidiotas de googleque utilizan operadores avanzados para buscar palabras clave en la Web, y Google Dorks no es Regex de todos modos.
Por curiosidad, intenté poner caracteres comodín en las URL, principalmente para imágenes de varios sitios, pero no funcionó. La mayoría de ellos mostraban varios códigos de error HTTP, con excepción de 2 o 3 que redirigían a alguna otra página dentro del sitio web.
Algunos ejemplos que no funcionaron:
- Buscando archivos PDF. Consiguió
404 : Page Not Found
- Buscando imágenes. Consiguió
500 : Internal Server Error
- Buscando todas las páginas HTML en el sitio web. Simplemente página de error
- Youtube convierte caracteres a caracteres hexadecimales seguros.
Un ejemplo que funcionó (no tengo idea de cómo):
Ver elQuestion Tagged
sección a la derecha de la página para ver todas las búsquedas de la palabralin*
Pido disculpas si la pregunta tiene demasiados detalles, pero me parece apropiado dar algunos ejemplos. Entonces aquí concluyo mi pregunta:
¿Se pueden utilizar expresiones regulares de alguna manera en las URL mientras se navega?
En caso afirmativo, ¿cuáles son las reglas o métodos para utilizarlos?
También,Sección de usosen la página de Wikipedia para expresiones regulares, cite esto:
Si bien las expresiones regulares serían útiles en los motores de búsqueda de Internet, procesarlas en toda la base de datos podría consumir recursos informáticos excesivos dependiendo de la complejidad y el diseño de la expresión regular. Aunque en muchos casos los administradores de sistemas pueden ejecutar consultas basadas en expresiones regulares internamente, la mayoría de los motores de búsqueda no ofrecen soporte para expresiones regulares al público. Excepciones notables: Google Code Search, Exalead. Google Code Search se cerró en enero de 2012.[39] Utilizó un índice de trigramas para acelerar las consultas.[40]
Entonces, ¿es posible realizar búsquedas con expresiones regulares en motores de búsqueda pero no en páginas web?
Respuesta1
Generalmente no.(Además, los comodines y las expresiones regulares no son lo mismo).
Cada sitio web decide completamente sobre suposeer cómo se debe interpretar la ruta y la consulta. Las rutas pueden corresponder a archivos reales o pueden asignarse a recursos abstractos como "preguntas" o "publicaciones". (por ejemplo, SuperUser en realidad no tiene una carpeta llamada questions
llena de subcarpetas numeradas; la ruta simplemente le indica qué respuesta generar).
Esto también significa que cada sitio web decide si admitirá comodines (o expresiones regulares o cualquier otro método de filtrado) o no. Por lo general, agregar esta función requeriría programación adicional en el sitio web.
Como descubrió, Superusuario implementó comodines para la exploración de etiquetas; es útil para encontrar todas las preguntas relacionadas con Windows (y probablemente fue más fácil de implementar que las etiquetas jerárquicas).
Pero, por ejemplo, los ID de vídeos de YouTube son completamente aleatorios, por lo que no sirve de nada intentar enumerar todos los vídeos cuyos ID comienzan con RgK...
o con cualquier otro prefijo. Entonces YouTube no implementó eso.
Servidores web "simples", que sólo sirven archivos .html normales,podríaimplementar esta característica ya que a menudo ya tienen listados automáticos de directorios. Sin embargo, muchos propietarios de sitios web no querrían esto; por ejemplo, podrían tener páginas "no listadas" que sólo son conocidas por unas pocas personas.
(Existe una característica similar en Apache httpd, que le permite obtener una lista completa del directorioincluso siHay un archivo index.html presente. Pero tiene que estar deshabilitado de forma predeterminada, porque muchas personas realmente confían en index.html como un método confiable para deshabilitar esos listados).