Estoy intentando analizar el contenido HTML de varios archivos de texto y seleccionar partes específicas de cada archivo y copiar este contenido para usarlo más tarde y pegarlo en el contenido de otro archivo.
El valor seleccionado se inyectará en una porción específica del contenido de otro archivo que tenga un nombre de archivo coincidente, esté en un directorio diferente y contenga contenido diferente.
El archivo que se actualiza con la parte seleccionada del contenido del otro archivo tendrá parte del contenido que deberá conservarse y permanecer igual.
Mas detalle
Supongamos que tengo este código html deARCHIVO-1.html:
<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="ro">
<title>YES, I love her</title>
<head>
</head>
<body>
...
<div id="coloana_centru">
<div class="container mM" id="incadrare_text_mijloc_2" itemscope itemtype="http://schema.org/Product">
<div align="justify">
<!-- * * * * * START HERE * * * * * -->
<p class="TATA"><em>At the mobile site I put as the header location in case the device isn't mobile? And then it executes the php code you gave stack..</em></p>
<p class="MAMA">Simply check if the referrer is coming from within your site. If they are, they have already seen a page and have chosen where they want to go next</p>
<!-- * * * * * END HERE * * * * * -->
</div>
</div>
</body>
</html>
Quiero copiar todo el contenido del texto deARCHIVO-1.htmla partir de...
<!-- * * * * * START HERE * * * * * -->
todo el camino hasta
<!-- * * * * * END HERE * * * * * -->
e inyectar esto enArchivo-2.htmlque está en una carpeta diferente en una región específica de su contenido de archivo.
Para cada archivo involucrado que sospecho, como se muestra en las dos cadenas anteriores, estos valores se pueden usar como delimitadores de algún tipo para controlar desde dónde copiar y dónde copiar.
esto es ambosARCHIVO-1.htmlyArchivo-2.htmlal lado de la anotación:
Archivo-2.htmlque necesita ser actualizado podría verse así:
<section class="page_header pb-0 w-100">
<div class="bg-overlay bg-black opacity-7"></div>
<div class="container">
<div class="row">
<div class="col-md-12 page-content position-relative text-white text-center">
<h2 class="mb-3">Blog Content</h2>
<h6 class="mb-2 text-white text-capitalize">Creativity leads to new inventions </h6>
<a href="../index-creative-studio.html" class="d-inline-block text-white">Home</a> <span><i class="fa fa-angle-double-right font-13"></i> Blog</span>
</div>
</div>
</div>
</section>
<div id="bingo">
<div class="container good-job" id="love" itemscope itemtype="http://schema.org/Product">
<div class="blog-listing-inner news_item">
<!-- * * * * * START HERE * * * * * -->
<p class="TATA"><em> Other text 1 </em></p>
<p class="MAMA"> Other text 2</p>
<!-- * * * * * END HERE * * * * * -->
<div class="profile-authors heading-space-half">
<h4 class="text-capitalize color-black mb-35px">Comments</h4>
<div class="any-profile mb-30px">
<div class="profile-photo"><img src="img/post6.jpg" alt="Comments"> </div>
Básicamente, copio solo el artículo de texto de un archivo para colocarlo en otro archivo. Ese texto, que también está en la clase, se pone entre comentarios.
El problema es que he cambiado 3000 archivos y solo lo he estado haciendo manualmente para conjuntos de archivos mucho más pequeños, por lo que intento encontrar un método más eficiente.
Ejemplo de directorios de archivos
Puede reemplazar esos comentarios largos <!-- * * * * * START HERE * * * * * -->
con <!-- * * * * * END HERE * * * * * -->
algo corto como <!--START1-->
y<!--FINNISH1-->
LA MEJOR SOLUCIONES ESTE, usandoPOTENCIA SHELL
$sourceFiles = Get-ChildItem 'c:\Folder1'
$destinationFolder = 'c:\Folder2'
foreach ($file in $sourceFiles) {
$sourceContent = Get-Content $file.FullName -Raw
$contentToInsert = [regex]::match($sourceContent,"(?ms)<!--START1-->(.+)<!--FINNISH1-->").value
$destinationContent = Get-Content $destinationFolder\$($file.Name) -Raw
$destinationContent = $destinationContent -replace '(?ms)<!--START1-->(.+)<!--FINNISH1-->',$contentToInsert
Set-Content -Path $destinationFolder\$($file.Name) -Value $destinationContent -Encoding UTF8
} #end foreach file
Respuesta1
Probablemente haya una mejor manera de hacer esto con Windows PowerShell, pero como está dispuesto a usar PowerShell, aquí hay una variación para ayudarlo que debería funcionar según lo que probé.
Potencia Shell
$src = Get-ChildItem -Path "c:\Folder-1" -Filter "*.html";
$destFld = "c:\Folder-2";
$src | % { Process {
If ( Test-Path "$destFld\$($_.Name)" ) {
Clear-Variable -Name ("a","b","c","x","y","z");
$z = Get-Content $_.FullName -Raw;
$y = "`t`t<!-- $((($z -split "<!--")[1]).Trim())`r`n";
$x = "`t`t<!-- * * * * * END HERE * * * * * -->";
$a = Get-Content "$destFld\$($_.Name)" -Raw;
$b = "$(($a -split "<!--")[0].Trim())`r`n";
$c = (($a -split "<!--")[2] -Split "-->")[1].Trim();
$b | Out-File "$destFld\$($_.Name)";
$y | Out-File "$destFld\$($_.Name)" -Append;
$x | Out-File "$destFld\$($_.Name)" -Append;
$c | Out-File "$destFld\$($_.Name)" -Append;
}
}};
Ejemplos de resultados de antes y después
File-1.html (usado para actualizar contenido)
<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="ro">
<title>YES, I love her</title>
<head>
</head>
<body>
...
<div id="coloana_centru">
<div class="container mM" id="incadrare_text_mijloc_2" itemscope itemtype="http://schema.org/Product">
<div align="justify">
<!-- * * * * * START HERE * * * * * -->
<p class="TATA"><em>At the mobile site I put as the header location in case the device isn't mobile? And then it executes the php code you gave stack..</em></p>
<p class="MAMA">Simply check if the referrer is coming from within your site. If they are, they have already seen a page and have chosen where they want to go next</p>
<!-- * * * * * END HERE * * * * * -->
</div>
</div>
</body>
</html>
Archivo-2.html (antes de la actualización)
<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="ro">
<title>No, I do NOT love her because she too ugly</title>
<head>
</head>
<body>
...
<div id="SheTooUgly">
<div class="container mM" id="incadrare_doc_mijloc_33" itemscope itemtype="http://schema.org/Product">
<div align="justify">
<!-- * * * * * START HERE * * * * * -->
<p class="TATA"><em>Girl too ugly to love</em></p>
<p class="MAMA">She way too ugly, yuk</p>
<!-- * * * * * END HERE * * * * * -->
</div>
</div>
</body>
</html>
Archivo-2.html (después de la actualización)
<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="ro">
<title>No, I do NOT love her because she too ugly</title>
<head>
</head>
<body>
...
<div id="SheTooUgly">
<div class="container mM" id="incadrare_doc_mijloc_33" itemscope itemtype="http://schema.org/Product">
<div align="justify">
<!-- * * * * * START HERE * * * * * -->
<p class="TATA"><em>At the mobile site I put as the header location in case the device isn't mobile? And then it executes the php code you gave stack..</em></p>
<p class="MAMA">Simply check if the referrer is coming from within your site. If they are, they have already seen a page and have chosen where they want to go next</p>
<!-- * * * * * END HERE * * * * * -->
</div>
</div>
</body>
</html>
Recursos de apoyo
-
EstándarAliaspara Foreach-Object: el
%
símbolo '', ForEach Acerca de los caracteres especiales
a.`t: Pestaña horizontal
b.`n: Nueva línea
C.`r: Retorno de carro
Donde C. y B. :
CRLF
fin de vidaCómo hacerlo: Cambiar los finales de línea de un archivo de texto