Estou tentando gerar os valores de determinados elementos em um feed RSS como colunas. A estrutura do feed RSS em questão é esta (abreviada):
$ xmlstarlet el ~/tmp/spotn-rss-20140323 | sort -u
rss/channel/title
rss/channel/item/content
rss/channel/item/description
rss/channel/item/link
rss/channel/item/pubDate
rss/channel/item/title
Depois de aplicar um comando xmlstarlet sel com um modelo, gostaria de ver uma lista de títulos de itens e suas datas de publicação organizadas em colunas.
$ xmlstarlet sel -t \
-v rss/channel/item/title \
-v rss/channel/item/pubDate -n ~/tmp/spotn-rss-20140323
Desired output: Actual output:
title1:pubDate1 title1
title2:pubDate2 title2
title3:pubDate3 title3
(...) (...)
pubDate1
pubDate2
pubDate3
(...)
Este problema parece bastante trivial e pensei que seria uma boa ideia verificaro guia do usuário. Acontece que o exemplo hello world com uma folha de estilo .xls fornece meios para obter o efeito desejado com pouco esforço:
<?xml version="1.0"?>
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text"/>
<xsl:param name="inputFile">-</xsl:param>
<xsl:template match="/">
<xsl:call-template name="t1"/>
</xsl:template>
<xsl:template name="t1">
<xsl:for-each select="rss/channel/item">
<xsl:value-of select="title" />^<xsl:value-of select="pubDate" />;
</xsl:for-each>
</xsl:template>
</xsl:stylesheet>
Obtenho a saída desejada com o comando transform, mas acho essa abordagem bastante complicada porque xml/xls é muitoprolixo. Meu objetivo é examinar rapidamente alguns elementos do xml, não quero escrever uma folha de estilo de aproximadamente 450 caracteres apenas para isso.
$ xmlstarlet tr /home/jaroslav/tmp/spotn-rss-style.xls \
/home/jaroslav/tmp/spotn-rss-20140323 |
column -ts^
Test Thu, 20 Mar 2014 18:58:11 +0000;
Assisterende borer – Songa Offshore Thu, 20 Mar 2014 12:48:03 +0000;
Maskinsjef Thu, 20 Mar 2014 10:23:16 +0000;
Maskinsjefer/Motorpassere Sun, 16 Mar 2014 16:37:15 +0000;
Skipsfører Sun, 16 Mar 2014 16:30:19 +0000;
Tilkallingsvikarar matros Thu, 13 Mar 2014 03:15:55 +0000;
Matros Wed, 12 Mar 2014 13:05:57 +0000;
1. styrmann Tue, 11 Mar 2014 05:44:31 +0000;
Overstyrmann Scan Trans Tue, 04 Mar 2014 06:35:29 +0000;
(...)
Seria mais útil se houvesse uma maneira de concatenar dois valores de cada <item>
elemento em <channel>
uma linha separada, sem recorrer a folhas de estilo xls ou editores de fluxo externos, como sed e awk.
Responder1
A folha de estilo xls fornece uma pista.
A folha de estilo do exemplo original possui, xsl:for-each select="/"
enquanto a da pergunta possui
select="rss/channel/item"
. Usando a mesma lógica, basta combinar rss/channel/item e imprimir cada título, pubDate com um delimitador:
$ xmlstarlet sel -t \
-m rss/channel/item \
-v title -o '^' \
-v pubDate \
-n ~/tmp/spotn-rss-20140323 |
column -ts^
Resultado
Test Thu, 20 Mar 2014 18:58:11 +0000
Assisterende borer – Songa Offshore Thu, 20 Mar 2014 12:48:03 +0000
Borer – Boring – Songa Offshore Thu, 20 Mar 2014 12:42:57 +0000
Hydrauliker – Songa Offshore Thu, 20 Mar 2014 12:34:56 +0000