phpにおけるマルチバイトマッチング

Perlでマルチバイトマッチングを行うためには、jcode.plで $a =~ /[亜-煕]/ のようにするとマッチングできる。また、Perl 5.6からはUTF-8にてマッチングが可能だ。
PHPでもmb_eregという関数が用意されており、こちらでマッチングできるのだが、perg_match関数のようなPerl互換の強力な正規表現は用意されていない。
すべての漢字を取り出す正規表現としてコードが公開されているが、もうすこし効率の良いマッチングがPHPでもできれば柔軟な正規表現をかけるのだが。
ところで、HotPHPPER Feedには結構面白いブログのフィードが投稿されているようなので、今後はチェックしていきたい。

カテゴリーPHP

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です