Eu tenho uma estrutura de pastas como a seguinte:
chapters/
01-chapter.md
02-chapter.md
03-chapter.md
format.sh
parse.sh
analisar.sh
pandoc -t html5+smart -so dist/book.html --html-q-tags chapters/*.md
formato.sh
for f in chapters/*.md;
do
pandoc "$f" -o "$f" -t \
markdown+smart+footnotes-escaped_line_breaks+example_lists \
--columns=80;
done
Minha ideia era basicamente usar o Pandoc não só como conversor, mas também como formatador - isso funcionou muito bem até que comecei a usar notas de rodapé:
Quando eu corroformato.shcada nome de referência que uso para minhas notas de rodapé é substituído por um número - o que seria bom, mas o problema é se eu executaranalisar.shRecebo a seguinte mensagem:
[WARNING] Duplicate note reference '1' at line 360 column 1
O problema é 01-chapter.md
e 02-chapter.md
ter uma nota de rodapé [^1]
. Basicamente, eu gostaria que o Pandoc lidasse com as notas de rodapé de cada arquivo separadamente e não permitisse referências cruzadas entre meus arquivos markdown, mas não consigo ver nenhuma maneira de fazer isso.
Alguém tem alguma ideia?
Responder1
Não há necessidade de lua
Eu apenas tropecei na --file-scope
opção. Adicione isso parse.sh
e você estará livre de problemas ...
--file-scope
Analise cada arquivo individualmente antes de combinar documentos com vários arquivos. Isso permitirá que notas de rodapé em arquivos diferentes com os mesmos identificadores funcionem conforme o esperado. Se esta opção estiver definida, as notas de rodapé e os links não funcionarão nos arquivos.
Responder2
Pandoc não foi projetado para funcionar como formatador, mas funciona razoavelmente bem na maioria das vezes.
Não há como fazer com que o pandoc preserve as notas de rodapé originais, então você terá que encontrar um método diferente. O desafio é fazer com que o pandoc leia os arquivos sequencialmente como documentos individuais e depois combine os documentos dentro do pandoc no documento final. Apenas passar todos os arquivos de entrada (via *.md
) faz com que o pandocconcatenaresses arquivos em um único documento antes de analisar a redução.
Minha sugestão seria usar um arquivo "index" (ou mestre). Pandoc Markdown não possui sintaxe integrada para inclusão de arquivos filhos, mas podemos criar a nossa própria com umfiltro pandoc Lua. Por exemplo, defina um arquivo que unirá todos os seus capítulos, onde os arquivos serão listados um por linha em um bloco de código:
``` include
chapters/1.md
chapters/2.md
chapters/3.md
```
Coloque o seguinte código em um arquivo include.lua
(retirado deesta essência)
--- Pandoc Lua filter to include other Markdown files
local List = require 'pandoc.List'
function CodeBlock(cb)
if cb.classes:includes'include' then
local blocks = List:new()
for line in cb.text:gmatch('[^\n]+') do
if line:sub(1,1)~='#' then
local fh = io.open(line)
blocks:extend(pandoc.read (fh:read '*a').blocks)
fh:close()
end
end
return blocks
end
end
Em seguida, chame pandoc com o filtro Lua e o arquivo mestre/índice como entrada:
pandoc -t html5+smart -so dist/book.html --html-q-tags --lua-filter=include.lua index.md
Isso tem a desvantagem de que você terá que editar index.md
sempre que adicionar um novo arquivo Markdown; além disso, apenas os metadados definidos no arquivo de índice aparecerão na saída (embora essas duas limitações possam ser evitadas com um pouco de codificação). Fora isso, deve fazer exatamente o que você procura.