unlimited blue text archive

もう一度正規表現

作成年月日
2006年01月24日 01:00

タブレットの使い過ぎか肩が凝った所に無理な姿勢を続けた為、首が寝違えのひどい状態になってしまい、真正面以外を向くと激痛が走るので仕事もゲームも出来ない。しょうがないのでキーボードだけで出来る作業に切替えて正規表現のリハビリを開始。手始めにSNSのhtmlをstrictなソースに変換する事が出来るかどうかを試してみる。(正確に言うと「俺に」出来るかどうかを試しているのである。やる人間を変えれば勿論「出来る」)

フリーソフトで余分な部分を外したソースからタグの書き換えに挑戦。正規表現の「最長一致の原則」に阻まれていたが<script[^>]*>や<a href[^>]*>[^>]*<\/a>の様な記述で一つの要素tagや要素全体を拾い出せる事を発見。(しかしこれだとinlineの要素タグが中に入っている時にはマッチしないか……)。

<br><br>を</p><p>にすれば段落を構成出来そうな気もするが、本文の最初と最後に入れる<p>や</p>にどう対処したもんか。それぞれの前後に来るタグはSNSの仕様上決まっているので、出来る事は出来るのだが、仕様が変わった時に書き換えなきゃいけない様なマクロは作りたくないんだよなー。

やっては忘れて、また思い出してはもう一度忘れるという事の繰り返しだが、死ぬ迄にはこの程度の事は出来る様になっておきたいなぁ。

追記

つまりこうしてこのページが出来てるという事は、なんとかマクロ作成に成功したわけである。肝は「.+?」という記述に拠る最長一致の原則外しだった。