プログラミング


2006年12月31日

アジャイル開発

開発プロセスの話。

特集:.NET開発者のための開発プロセス入門ではウォーターフォール型、反復型、アジャイル型の開発プロセスとは何か?そしてなぜこれらの開発プロセスが生まれたかについて詳しく説明してある。

そしてアジャイル開発における重要なポイントが記載されており、.NET開発者でなくてもより生産性の高いプログラミングを行いたいと考えている人には、一読の価値があるだろう。

2006年12月20日

プログラムのすすめ

プログラミングは言語が何であれ、以下に注意すべきだろう。

・ロジックとインターフェイスを分離する
フレームワーク云々の話もあるだろうけれども、ロジック内でエラーが発生し、メッセージを出したいような場合においてもロジックではエラーコードだけを返すようにして、呼び出し側でメッセージ処理をさせる必要がある。そもそも、これを行う上ではモジュールの細分化(機能単位で関数を分ける)は必要不可欠であるといえる。

・マジックナンバーを避ける
ロジック内に数値が入るとその数値の意味がわからなくなる。同じ目的で使用されている数値は特に定数化しなければ保守性が低下してしまう(1つの数値を直すときに、複数の箇所を直さなければならなくなる)。

・コピー&ペーストを避ける
ロジックをコピー&ペーストをしようとしているとしたら、それは大きな間違い。いくら工数が短くなるとはいえ、その部分は共通化できることを意味しているわけだから、少しくらい時間をかけてでも共通化し、保守性を高める努力を怠ってはならない。

2006年09月19日

正規表現

多くのプログラミング言語でも正規表現は実装されているが、実はかなり奥深い。そして、普通の人が聞いたら間違いなく「性器表現」と勘違いする不思議な言葉だ。現在、Oreillyから出版されている『詳細 正規表現 第2版』を読んでいて改めて正規表現について認識する必要があると考え、以下のとおりまとめてみた。これは今後順次改訂していく予定です。

正規表現の種類
正規表現にはPerlやPHP, Java, .NET, Python, Ruby, sedに実装されているNFAとawk, egrep, MySQLで実装されているDFAというものがある。NFAは従来からある正規表現であり、記述方法で動作速度が決まる。つまり、どれだけでも遅い正規表現を書くことが出来る(ひどい場合ではSegumentation Faultとなり、実行できない)と言うことになる。NFAで正規表現を記述するにはそれなりの知識と経験が必要になる。
一方で、DFAは最適化される正規表現であり、効率の悪い正規表現も実行動作前(コンパイル時)に最適化されて実行することになる。


文字クラス
リテラルをグループ化して、いずれか1つをあらわす。

[a-z] 小文字のアルファベットすべて
[^a-z] 小文字のアルファベット以外(「^」を最初におくと文字クラスが否定される)
[0-9] 数字すべて
[a-zA-Z] 大文字小文字を含むアルファベット
[a-zA-Z&[^mM]] 大文字小文字を含むアルファベット。但しMおよびmは除外される。


グループ
複数のパターンを表す。

(a|bc) aまたはbc
(?!a|bc) aでもbcでもない(否定形)


量子指定子
前に付くリテラルならびに文字クラス、グループを修飾する。

* 0文字以上
+ 1文字以上
? 0または1文字
{2,5} 2文字以上5文字以下
{,5} {0,5}の省略
{3,} 3文字以上


NFA拡張(Perl拡張)
NFA拡張にはキャプチャなし括弧(?: ...)、先読み(?= ...)、戻り読み(?<= ...)がサポートされている。
(?:aaa|bbb) aaaまたはbbb。但し(aaa|bbb)と異なり、括弧の中は$1で取得できないようにする(つまりメモリを節約することができる)。

(?<=aaa)bbb 直前にaaaがくるbbbにマッチ(先読み)。
(?<!aaa)bbb 直前にaaaがこないbbbにマッチ(否定先読み)。
aaa(?=bbb) 直後にbbbがくるaaaにマッチ(戻り読み)。
aaa(?!bbb) 直後にbbbがこないaaaにマッチ(否定戻り読み)。


・モード修飾子
多くの言語の場合には、大文字小文字の区別なしや改行を無視するiやxのモードを言語側で用意している。たとえば、Perlでは
$a =~ /a-z/i; #大文字小文字のアルファベットにマッチ
$a =~ /abc
def/x; #abcdefにマッチ(正規表現内の改行とタブを無効化する)
だが、正規表現内でもこれが利用できる。
(?i:[a-z])、(?:x:abc
def)で代用できる。iモード修飾子の場合には、正規表現内で大文字小文字を区別しないケースとするケースを混在させられる便利な修飾子といえる。


・欲張り型と非欲張り型
NFAにはバックトラックと言う機構によってパターンマッチングを行っている。バックトラックを抑止する方法が欲張り型であり、後続のマッチ文字列に配慮することなくマッチングする。逆に量子指定子の働きを最大限抑制する方法が非欲張り型である。いずれもNFAでサポートされている。
.++または(?>.+) 任意の文字列を欲張り型でマッチ(この場合はほとんど全ての文字列にマッチすることになり、後続するマッチ文字列の指定があれば失敗することになる)
.+? 任意の文字列を非欲張り型でマッチ。.+?aは[^a]+と同義となる。また、.*?aは[^a]*と同義。バックトラックが起こらない分だけ、それぞれ同義のマッチ文字列の方が早い。

2006年06月11日

プログラマの三大美徳

ラリーウォール先生が著した三大美徳について。プログラマは、以下の気質を持つべきとされる。

・無精
無駄なことはしない。つまりめんどくさがり屋であること。めんどくさいと思えば、冗長化したコーディングは行わない。

・短気
短気は損気とも言うが、短気であることはより処理速度の速いコーディングをできるようになるものだ。ただ最近はマシンのコストも下がってきたので、マシン頼みにすることもできるわけだが、経済的にも環境的にもよくないだろう。

・傲慢
傲慢であれば他人にケチをつけられないコーディングをできるようになる。

いずれも参考ページをもとに自分なりの解釈でもって書いてみた。自分もラリーウォール先生の教えに近づけるよう努力したい。