2009年06月

多読術

松岡 正剛, 筑摩書房(ちくまプリマー新書), 2009.

インタビュー形式で、松岡さんの読書感・読書法が書かれている。

内容を大雑把に要約すると、「もっと気楽に、もっと自由に、もっとアクティブに本を読もうよ」というもののようだ。

ところで、それはいいんだけど、オペラ・プロジェクトのその後ってどうなっているか知っている人、いませんか?

フェレット

突然ですが、フェレットを飼っています。

巣の中に薄手の毛布というか、潜り込めるような感じの布を入れています。これまでは布に潜り込んで寝ていたのですが、さすがに暑くなって来たのか、最近は帰ってくると顔だけ出して寝てたりします。

目が覚めてくると欠伸をする様子も見えて、これがかわいい。目が覚めかけた頃に、巣に顔を近づけて覗き込んでいると、寝ぼけた感じでこちらを見返して来ます。その内、目がはっきり覚めたんでしょうね、「おぉ! 居るじゃね〜か!」という感じでバタバタと布から這い出し、「居るなら外に出せよ!」という感じで巣の金網に噛り付いてきます。この一連の動作もまたかわいい。

あ、雌なんで言葉遣いは上とは違うかも(笑)。

ただ、もう7才なんで、気持ちとしては覚悟してます。

TERMINATOR SALVATION

TERMINATOR SALVATIONを昨日観てきました。面白かったですよ。

ただ、"彼"が献体してから、再度現れるまでの間はどうなっていたのか? それが良く分かりませんでした。パンフにほんの少しだけ書かれてるけど、それだけでは良く分かりません。

さて、こういう展開になって来ると、親父さんを過去に送るのに関連したミッションで、後一作くらいは作れそう。TERMINATOR 2と3(もかな?)のネタはそれと被りそうだから、一まとめにしてしまうか…

でも、ジョンの子供がどうのこうのという話もT3であったので、もしかしてまだまだ続く?

gawk 3.1.x

もう10年ちょっと前になりますか、jgawk 2.xには大変お世話になりました。その後、しばらくプログラミングから少し離れ、現在はRubyをメインに使っています。

ところが、先日ちょっと思い立ってgawkを検索したら、プロセス間通信が可能になったり(これは古いバージョンでも一応出来たけど、正式なやり方が追加されたみたい)、C言語による機能拡張が出来るようになったり、ネットワーク通信が出来るようになったりしているみたいです。

う〜ん、またgawkをいじってみようかなぁ。jgawkで作ったプログラムで、別の言語に移植するのが面倒なものもあることだし。

REBOLのドユメント

お金にならないのに、REBOLという言語のドキュメントの邦訳をしています。おまけに、REBOLは、最近はやりのオープンソースでもありません。なんとなく見た感じで興味をそそられたので、ちょっとやってみようかなという感じです。

ただ、ドキュメントの量が多いです。おまけに、現在ver. 3への移行期で、古いドキュメントと新しいドキュメントの両方をどうにかしなければいけないので、作業は遅々として進みません。一応、認証付きの自分用のwikiを立ち上げて、そこで作業しています。

自分用のwikiは、hikiというのを使っていまして、hikifarmという機能で複数のwikiを立ち上げることが出来ます。なので、他にもいくつかwikiが立ち上がっています。研究用の試料にするための翻訳も、そのうちの一つで作業が出来るようになっています。こちらも遅々として作業が進みませんが。

予算が決まらない

それにしても、予算が決まりません。

と、言いつつ、予算額を見越した上で、すでに一回出張していますが。

予算が決まったらノートパソコンを買い換えて、紙を買い込んで、今のところの予定はそれくらいか。ノートパソコンも直販では買えなくて業者を通すんだろうな。別段困ることがあるわけじゃありませんが。

正規表現とテキスト・マイニング ―情報発見のツール・キット

佐良木 昌, 新田 義彦, 明石書店 (2003/10).

日報などを蓄積し、それらに対して自然言語処理を行なわず、正規表現とKWICにより、知識発見を行なおうということが主題の本。実際のテキストマイニングでは、自然言語処理もするし、統計処理もするのだが、この本ではそれらはばっさりと切り捨てられている。

ところでKWICのツールって意外に少ないんですね。単に日本語対応しているのが少ないだけなのかな?KWICK Finderなんか機能は多彩ですね。Linux or Javaだとなんかこれといったものが見つかりませんね。見落としてるだけかもしれませんが。

「日報など」と書いたが、著者は日報などを定型フォーマットかつメールなどで提出させる方法を想定・提案している。この点、私が手がけ始めている研究とも通じるものがある。

しかし、統計処理を行なわないことなどから、当然大量のデータへの対処には不安が残る。というか、多分対応できない。なので、身近なところでテキストマイニングを体験してみたいという方には、参考にかもしれないし、テキストマイニングってどんなことをやっているのという方にも、おそらく少しは参考になるだろうという感じです。

むしろ、用いるツールによっての文字範囲の指定の違いなど、正規表現の勉強には役立つかもしれません。ついでに言えば、それにあわせて、付録に乗せてある正規文法がどうのこうという部分のほうが内容が濃かったり、ためになったりするんじゃないかとも思います。

Book Factoryの...

書き漏らしました。

Book FactoryMini Lab / Engineering NotebooksのPIVOT Layoutというのも面白そうですが、ここ、配達が早いのは良いのですが、送料が高いんですよね。試してみたいけど、躊躇してます。

メモ帳の代替わり

何年か前から、クレールフォンテーヌのAge Bagというメモ帳を使っていますが、今日、代替わりをしました。大体1年に1冊のペースです。ゆっくりですね。思いついたメモとか、買い物のメモとかくらいにしか使ってないので。仕事のメモはそれようのノートを使ってますし。ちなみに、そちらもAge Bagで、A5サイズのやつです。でも、数冊目になると、さすがに転記の量が増えてきました。そろそろなにか方法を考えないといけません。

なぜこのメモ帳を何年も使っているかというと、厚手の紙で作られてるところが気に入ってます。1冊180ページちょっとで、RHODIAと同じ紙かな? RHODIAと同じ罫線が入っています。人によってはRHODIAよりもこちらの方が罫線が濃いという人もいますが、私は同じようなものだと思いますが。これに慣れる事が出来る人と慣れない人がいるでしょうね。ちなみにわたしはこのメモ帳を使い出してから罫を無視することを覚えました。

しかしですね、数年前(もうちょっと前?)から比べると製品の品質が劣化しています。本質的な部分ではないのですが。例えば、表2(というのかな)と中身、および表3(?)と中身を貼り付ける紙が、昔のものは表2および表3の前面に貼ってあったのですが、今のものは一部のみの貼り付けになっています。で、使っているうちにそこが剥げたりします。それで表紙と中身が取れることはないのですが、どうもいやなので、剥げたらボンドで貼り付けています。それと、昔は8丁綴り(というのかな?)だったのが、今は6丁綴り(?)になっています。昔の方が工程かなんかが多かったんでしょうね。

ちなみに、方眼罫ですが、国産のものは一冊の罫の位置がきれいにそろっている製品が多いと思いますが、この製品は揃ってなかったりします。そういうところも気になる人は気になるでしょうね。

ついでに、もし、メモ帳の自作を考えている人がいましたら、得丸さんが比較的お勧めだと思います。結構注文を聞いてくれたり、中身の罫も自由度が高いです。
記事検索
アクセスカウンター
  • 今日:
  • 昨日:
  • 累計:

livedoor プロフィール

skoba34

QRコード
QRコード
  • ライブドアブログ