2009年12月15日火曜日

Google Sites における HTML の不要なタグや属性を一括で削除 - 正規表現を使って

1. フォントの装飾だけ取り除きたい

Google Sites は、Google ドキュメントのように文字に色を付けたり、サイズを変更することが簡単にできる。

SnapCrab_NoName_2013-1-8_0-13-30_No-00しかし、お手軽さが災いし、文字の装飾を繰り返すと、元の状態に戻したくても修正するのが面倒になる。(+_+)

メニューより、

「書式 > 書式をクリア

により、文字の装飾を削除することはできる。しかし、「見出し」や「リスト」を適用した段落設定も消えてしまう。

 

2. エディタを使い正規表現で一括削除

Google Site では、ツールバーの右端にある

  • 「HTML ソースを編集」ボタン

を選択し、フォントの装飾情報を直接削除することができる。しかし、一々手作業で削除するのは気が遠くなる。そこで、正規表現で文字列を置換できるエディタを使い、フォント情報を削除することにした。

SnapCrab_NoName_2013-1-8_0-15-34_No-00ここではエディタとして Aptana を利用する。

 

a. Firefox のアドオン It’s All Text! で HTML を編集

SnapCrab_NoName_2013-1-8_0-18-11_No-00Firefox のアドオン It's All Text! を使うと、ブラウザのテキストエリアをエディタで編集できる。

It's All Text! をインストールし、エディタを Aptana に設定した。

SnapCrab_NoName_2013-1-8_0-19-1_No-00次に、Google Sites で、メニューボタンの右端にある HTML を編集するボタンをクリック。

It’s All Text! がインストールされていると、右端に「編集」ボタンが表示される。これを右クリックし、

「.html」として編集

を選択する。

091215-021.png

 

b. 正規表現で置換

Aptana で編集対象の HTML が開かれたら、メニューより

  • Edit > Find/Replace

を選択する (Ctrl + F)。

091215-019.pngダイアログの Options で Regular expressions にチェックを入れる。 

例えば、 HTML における style 属性と Font タグを削除したいとする。

style 属性を正規表現で指定するには、

style=(.+?)"

Font タグを指定するには、

<font(.+?)>|</font>

よって、Find: フィールドには

style=(.+?)"|<font(.+?)>|</font>

と指定すれば良い。Replace With: フィールドは空にしておく。

後は、Replace/Find ボタンで確認しながら除去する。

ついでに、メニューより Edit > Format を適用しておくと、見やすくなる。

Aptana で編集したファイルを保存し、Google Site に戻り、HTML が更新されたのを確認したら、更新ボタンを押す。