リンクと画像の抜き出しツール

URL
ソース
(テキスト)
ファイル名取得 タグ取得 属性取得 行取得 URL検索
画像出力 表示方式 整理
(高さ
テキスト出力 テキスト HTML    
(注:抽出結果をソースに入れ換えます)

使い方

機能の概要

HTMLファイルからタグを参照し、リンクまたは画像のファイル名を抜き出します。ファイル名を羅列したテキストにも対応。

画像として扱う拡張子:

リンク取得の手順

1.画像のURLやリンクを含むテキストをコピーします。(掲示板の書き込みや、HPのソースをコピー)

2.上記フォームのソース(テキスト)欄にペーストします。

3.HTMLソースをコピーした場合、URLが省略されていることがあるので、元ページのURLをコピーしてフォームのURL欄にペーストします。

4.ファイル名取得は、どこに記述があるかによって、「<a>」「href」「src」「background」を使い分けます。httpで始まるURLの場合、URL検索で取得できます。

5.テキスト出力をします。(ソース欄が入れ替わります)

画像取得の手順

1~3までは上記と同じ。

4.ファイル名の取得方法を選択します。元がソースの場合、タグ取得の「<img>」を押します。テキストの場合は、URL検索の「画像」を押します。

5.画像表示から出力方式を選びます。固定を押すと高さが揃って見やすいです。

画像の保存

表示された画像の上で右クリックをして保存することができます。
一括で保存したい場合は、画像表示の出力方式から「別窓」を選びます。保存用ウィンドウを表示しますので、これをブラウザのメニューでページを丸ごと保存(完全保存)すると画像も一括でファイル出力されます。(Firefox推奨)

リファレンス

URL 入力欄 ソース内のファイル名はURLを省略していることが多いため、ソースのあるURLから補足
OPEN URLのリンク先を別ウインドウに表示
GET 子ウィンドウのURLを取得。 ただし、別サイトのページにはアクセス不可
ソース 入力欄 ソースファイルやURLのリストを入力
ファイル名取得 URLの抽出方法を選択します
タグ取得 <a> ソースの中の<a>タグからファイル名を抜き出します。<target>タグにhref指定がある場合はこれを参照
<img> ソースの中の<img>タグからファイル名を抜き出します。<target>タグにhref指定がある場合はこれを参照
属性取得 href タグ内の属性を検索し、属性値にあるファイル名を取得
src
background
行取得 画像 単純に行単位でテキストを分轄して、ファイル名として取得
URL検索 全部 「http://」(h省略に対応)で始まる文字列を検索し、ファイル名として取得
タグ外 タグ内に含まれないURLを検索して、ファイル名として取得(URLにリンクが付いている場合、二重に取得するのを防ぐため)
画像 画像の拡張子を検索し、URLとして表示できそうなものを抽出
拡張子 拡張子を指定して抽出(クリックすると拡張子の入力ダイアログ)
画像出力 画像の出力方法を選択します
表示方式 固定 高さで指定した値を画像の高さとして表示
個別 取得した画像の大きさでそのまま表示
別窓 新しいWindowを開き、個別の大きさで画像を表示(HTMLを完全保存すると画像ファイルが取り出せる)
整理 自動 表示した画像のうち、表示できなかったものや、同じURLがある場合に削除を実行
選択 画像の選択リストを表示し、チェックマークを外し「画像リスト更新」を押すと、不要な画像を削除
並替 URLリストを並べ替える
テキスト出力 抽出したURLをソース欄に出力します
テキスト 一覧 取得したURLを一覧形式(行単位)のテキストにし、ソース欄に出力
HTML リンク 取得したURLをリンク形式でソース欄に出力
画像 取得したURLのうち画像の分を<img>タグに加工してソース欄に出力
別窓に画像を出力するときのHTMLと同じ

戻る