web上のホームページのサイトからHTMLのタグを除いて、テキスト部分だけを抽出したいと思い、ウェブ上でできるサービスを探してみました。
「HTML テキスト 抜き出し web上」で検索
ありました。
HTML テキスト抽出(簡易)─ Nihongo Web Corpus (NWC) Toolkit ─
http://s-yata.jp/apps/nwc-toolkit/text-extractor
text抽出したいURLをコピペするだけ。
今回テキストが欲しいページは、右クリックでページのソースが表示できないタイプのHTMLでしたが、無事?取り出しできました。
コメント