
У меня в электронной почте есть несколько месяцев оповещений Google, и я хотел бы поделиться ими где-нибудь в Интернете (например, на вики MediaWiki). Есть ли простой способ их экспортировать?
Оповещения содержат HTML-код следующего вида (видно из Thunderbird):
<div style="color:#fff;font-size:9px;letter-spacing:0.8px"> <div style="padding:3px 0px 4px 4px;background:rgb(255,255,255);background-color:rgba(0,0,0,0.5);width:96px">La Provincia di Biella</div> </div> <!--[if gte mso 9]></div><![endif]--> </td> </tr> </table> </a> <div> <span style="padding:0px 6px 0px 0px"> <a href="https://www.google.com/url?rct=j&sa=t&url=http://www.laprovinciadibiella.it/web/castelletto-cervo-nei-siti-cluniacensi-9458&ct=ga&cd=CAEYACoTMzc2NjcxMzA4NDYzNjc4NjUwMjIZZThjOGE1NjBlZjA5ZDRkMDppdDppdDpJVA&usg=AFQjCNEW4QKACEvE_AbGrMGOBJ2y4dFSIw" style="color:#427fed;display:inline;text-decoration:none;font-size:16px;line-height:20px">Castelletto Cervo nei siti cluniacensi</a> </span> <div> <div style="padding:2px 0px 8px 0px"> <div style="color:#737373;font-size:12px"> <a style="text-decoration:none;color:#737373">La Provincia di Biella</a> </div>
решение1
Этотсработало для меня:
- загружать оповещения из вашей электронной почты в каталог Thunderbird;
- установите плагин ImportExportTools и экспортируйте весь каталог как HTML;
- перейдите в каталог экспорта и выполните:
find * -print0 | xargs -0 -I § bash -c 'NAME="§"; DATE="{{#time:j F Y| ${NAME:0:8} }}"; grep --text -Eo "ru=([^&]+)&" "§" | sed "s,ru=,;$DATE:,g" | sed "s,&,,g" ; ' | sort -ru
Я использовал ;$DATE:
в качестве префикса для каждого URL, потому что это значимый вики-текст ифункции парсерапозволяют легко переводить формат "AAAAMMDD", используемый в файлах экспорта. Вы можете заменить на что угодно.
Более умная версия может отправить URL в Zotero или Citoid, чтобы получить надлежащую ссылку, или, возможно, проанализировать исходный HTML, чтобы извлечь больше информации. Формат HTML, похоже, отличается для оповещений до 2014-01-18.
Протестировано с GNU findutils 4.5.12, bash 4.3.42.
TODO: загрузить ссылки "посмотреть больше статей" и проанализировать их тоже. В загруженные дни письма содержат только случайную подборку "топовых" новостей.