
wget を使用して Web サイト全体の単語数をカウントできるかどうかを知りたいです。
すでに試した人はいますか?
これまでに私が見つけたものは次のとおりです:
wget -q -O- http://www.website.com | grep -c .
答え1
wget -q -r -O- http://www.example.com | wc -l
しかし、サイトが静的でなかったり、パスワードで保護された領域があったり、フォームが含まれていたりする場合は、すべてを簡単に取得することはできません。
たとえば、Amazon ですべての単語をカウントする必要がある場合は、ワンクリック アカウントに関連付けられたクレジットカードにチャージする必要があるかもしれません :-)