Monday, October 27, 2008

acm ICPC programming contest - Asia regional contest at Aizu

会津大学で開催されていたacm International Collegiate Programming Contest, Asia Regional Contestに行ってきた。

会場についたら Commentaries on Problemsの後半だった。「あれ? scheduleによればまだJava Challenge Competitionのはずなのになー」と思ってたらどうやら順番がいれかわってみたいで 16時すぎからが Java Challenge Competitionだった。
その後はAward and Closing Ceremony。Sponsorとしてちょっと挨拶。


月曜は会津若松を小雨の中ぶらぶら。鶴ヶ城などを観光してきた。
いく途中、甲賀町とかを発見。「なにか甲賀とゆかりが?」とおもったら、「蒲生氏郷が近江の日野から伴った者を居住させ日野町と名づけたが、加藤義明が「火」を忌み嫌って、同じ近江の郡名をとってこの名に改めた」とか書いてあった。なんだってー。

しかし、重い荷物で歩きまわってだいぶ疲れた。小雨の中を歩いていたせいかちょっと熱がでてきたぽい…

Wednesday, October 15, 2008

即興スクリプティング

「こういうことしたいんですけど、どうすればいいですかねえ」という質問を受けた。 "こういうこと"というのは次のようなことだった。
  • あるテキストの入力ファイルがあり、中身は次のようなかんじ
    Mapping JP {
      ...
    }
    Mapping AU {
      ...
    }
    Mapping JP {
      ...
    }
    
  • Mapping XX {という行ではじまり}でおわるのが一つのブロック。
  • この中で Mapping JP { ... }というブロックをすべて抜きだしたい
「ああ、それならsedで簡単にできますよ。」
こんなかんじで
 % sed -ne '/^Mapping JP {/,/^}/p' datafile
  • defaultでは出力しない(-nオプション)
  • Mapping JP {ではじまる行から、}ではじまる行までは出力する(/start/,/end/ という範囲で pコマンド)

しばらくして…
「実はフォーマットがちょっと違ってました。これならどうなりますか?」
  • テキストの入力ファイルがあり、中身は次のようなかんじ
    Mapping {
     id: foo
     country: "JP"
     ...
    }
    Mapping {
     id: bar
     country: "AU"
     ...
    }
    Mapping {
     id: baz
     country: "JP"
      ...
    }
    
  • Mapping {という行ではじまり}でおわるのが一つのブロック。
  • この中で country: "JP"を含むブロックをすべて抜きだしたい
「うーん、sedだとちょっと面倒だなあ。hold spaceかな」
といっていたら
perlでmultiline regexp使ったら簡単じゃないですか?」
で、でてきたのがこれ
% perl -n0e 'print "$_\n" for /^Mapping {[^}]+country: "JP"[^}]+}/gms'\
   datafile
  • sedawkのようにループして処理する(-nオプション)
  • record separetorとしてnull文字を設定する(-0オプション)。つまりファイルを全部一気に読む
  • ファイル全体に対して^Mapping {[^}]+"JP"[^}]+}にマッチする部分をそれぞれ出力する。gでglobal matching、mでmultilineとして処理する(^は文字列の先頭にマッチするのでは行頭にマッチするようになる)、sでsinglelineとして処理する(.なども改行文字にもマッチするようになる)
ちなみにsedだとこう
% sed -ne '/^Mapping {/,/^}/H;/^}/{s///;x;/country: "JP"/p}' datafile
  • defaultで出力しない(-nオプション)
  • Mapping {ではじまる行から}ではじまる行までhold spaceにためていく。(/start/,/end/ という範囲で Hコマンド)
  • }ではじまる行で次の処理を行う({...}で処理するコマンドをグルーピング
  • s///でまず現在の行(})を消す
  • hold spaceをpattern spaceに戻す(xコマンド)
  • 戻してきたpattern spaceでcountry: "JP"があれば出力(pコマンド)
最初s///するのを忘れていて、無駄な}がでちゃうなあというあたりでちょっとはまっていた。でもperl版より短い。

ちなみに世の中にはsgrepとかいうのがあって、次のように使えるっぽい
% sgrep 'outer("Mapping {" .. "}" containing ("country: \"JP\""))'\
   datafile
  • Mapping {から}の中にcountry: "JP"が含まれていたらそのブロック全体を出力
まあ、わかりやすいように見えるけどこのsyntaxを覚えとく価値はあるんかなあ。

Saturday, October 11, 2008

Manage It!

Manage It!が届きました。
プログラミングの本ではなく、(主にソフトウェア開発)プロジェクトのマネージメントはどうすればいいのかといったことを説明した本です。今回は監訳以外にレビューしてもらったので、より読みやすい訳、わかりやすい内容になっていると思います。

Wednesday, October 8, 2008

3分 Code Reading - date編

晩飯くってまったりしている頃にIRCを見ると次のような会話が。
22:44 <yaegashi> unix time からふつうの時刻表記に直すのはどうやる
22:44 <yaegashi> irb とかつかわずに
22:45 >ukai< % ruby -rtime -e 'puts Time.at(1234567)'
22:46 <yaegashi> いやだから ruby とかつかわんで(わら
22:46 <ar-m> dateコマンドで
22:46 <yaegashi> date(1) でなんとかできんのかな
22:46 <ar-m> できそうなもんだけどな
そうだなあ と思い、ちょっと調べてみることにした。 出力する方はdate +%sだけど逆はないものか。 まず何も考えずに
% date -d "$(date +%s)"
date: invalid date `1223478096'
で駄目。 date(1)を見てもちゃんと書いてない。
オプション
-d datestr, --date datestr
現 在の時刻・日付の代わりに、 datestr で指定された時刻・日付を表 示する。 datestr は普通のフォーマットならだいたいなんでも使う こ とができる。月名、タイムゾーン、`am' や `pm' なども用いてよい。
man -L C date しても特に情報はなさげ。 そういう時はやっぱりソースを見るのが早いかなと思うが、ソースとってきて展開するも面倒だなあと。(まあ apt-get source coreutils でいいんだけど) というか、こういう時こそwww.google.com/codesearchではないかと思い出し、早速検索。 dateコマンドはcoreutilsパッケージの中にあったよなということで、まずはdate.c coreutilsで検索。最初の候補はman/Makefile.am。manじゃないので..へ移動してみて、srcに移動。 するとdate.cがあるのでそれを見てみる。ざっと見ていくと
335  switch (optc)
336    {
337     case 'd':
338       datestr = optarg;
339       break;
とあるのでdatestrをたどっていきoption_specified_date = truereference = NULLなので
494  /* (option_specified_date || set_date) */
495     if (reference != NULL)
496        {
497          if (stat (reference, &refstats) != 0)
498             error (EXIT_FAILURE, errno, "%s", reference);
499          when = get_stat_mtime (&refstats);
500        }
501      else
502       {
503         if (set_datestr)
504           datestr = set_datestr;
505         valid_date = get_date (&when, datestr, NULL);
506        }
に辿りつく。get_datedate.cにはなさそうなのでcoreutils-6.6.tar.bz2get_dateを検索するとgetdate.cが見つかる。が、これbisonで生成されたコードなので、元のgetdate.yの方をみてみる。 ざっと見ると
238 spec:
239     timespec
240    | items
241    ;
242
243 timespec:
244  '@' seconds
245    {
246      pc->seconds = $2;
247      pc->timespec_seen = true;
248    }
249   ;
を発見。どうやら @を数字の前につければよいらしい。 というわけで試してみる。
% date -d "@$(date +%s)"
2008年 10月  8日 水曜日 22:54:21 JST
% LANG=C date -d "@$(date +%s)"
Wed Oct  8 22:54:21 JST 2008
結局manとか読んだりいろいろ試したりするのに5分少々、codesearchしはじめてからここまでは3分少々なかんじ。ということで報告
22:55 >ukai< わかった
22:55 >ukai< date -d "@$(date +%s)"
22:55 >ukai< @ をつけるべし
22:59 <yaegashi> @ てなんだ
22:59 <yaegashi> きいてないぞ
23:00 <yaegashi> どういうことだ
そういやinfoを見てなかったなあ と思ってinfo dateを見ると書いてあるね。
File: coreutils.info, Node: Seconds since the Epoch, Next: Specifying time zone rules, Prev: Pure numbers in date strings, Up: Date input formats

27.8 Seconds since the Epoch
============================

If you precede a number with `@', it represents an internal time stampas a count of seconds. The number can contain an internal decimalpoint (either `.' or `,'); any excess precision not supported by theinternal representation is truncated toward minus infinity. Such anumber cannot be combined with any other date item, as it specifies acomplete time stamp.
まとめ
  • Epoch time/unix timeから普通の時刻表記にする時には unix timeの前に @ を付けたものを datestr として date(1)の -d オプション(--dateオプション)に渡せばよい。
  • www.google.com/codesearchで検索するのが楽
  • GNU productsはmanよりinfoを読もう。see GNU Coding Style: Man Pages
    In the GNU project, man pages are secondary.