プログラム言語やSQL、テキストエディタで使用可能な「正規表現」を使う際の、考え方と処理のイメージを、具体的な例題を交えて解説します。第1回は肯定先読み・肯定戻り読みの使い方を紹介します。
Google の新しい JavaScript エンジンの v8 が話題になっている昨今ですね。v8 のすばらしいところは、 C++ のライブラリとして再利用しやすくなっているということではないでしょうか。C/C++ で書いた関数を容易に javascript の世界に export できるので、とても便利です。 一方で、クライアントサイドで利用している JavaScript をサーバーサイドでも利用したいというニーズがあるのはみな...
はてなダイアリーが AtomPub で編集できるようになったので、早速 fuse を使ってファイルシステムを作ってみました。こんな感じに使えます。 http://rails2u.com/tmp/diary_fuse/fuse.htm (動画) /create に保存すると現在時刻で作成 /20080820101010 など、エントリーを編集可能。保存で更新。 rm するとエントリーを削除 /\d{14} 的なファイル名で保存すると、その時刻のエントリーを作成 などなど。Ru...
『 PHPファイルアップローダー。スクリプトをダウンロードしてサーバーで自由に使える。 』
サーバのチューニングをする上でかなりやっかいなのがデータベース系。特にログファイルの量が膨大になると後から中身を見て問題を分析するのも一苦労という場合が。そんなときにこのMySQL用topコマンド「mytop」を使えば一体何が起きているのかがすぐにわかるので問題点の把握が容易になります。ベンチマークするときに併用すればかなり効率が良くなるのではないかと。 イ...
リリースされてからずっと手を出したかったPlaggerにやっと手を出した。 これで俺も「それPla」とか言っちゃったりできちゃうわけ! いひひ。 ちなみにPlaggerっていうのはRSSとかその他のいろんなのを拾ってきてなんか形にして出力するっていう優れもの。 インストールが面倒だって聞いてたけど、そうでもなかった。FedoraCore4、Perl5.8.6の環境でcrawler.jp::blogさんの「Plaggerをインス...
このサイトは、にしし(西村文宏)個人が運営しています。このサイト内で公開している文章や画像・ソフトウェアなどの著作権は、にしし(西村文宏)にあります。許可なく複製・転載・販売することは御遠慮願います。詳しくは、インフォメーションをご参照下さい。 なお、私について詳しくは、プロフィールや日記などをご参照下さい。(笑) ●雑誌掲載などについて For M...
まなめさんに微妙な記事を「導入編」としてリンクされてしまったので(汗)、改めて書き直します。 下準備 Plaggerをインストールします Windowsで簡単にPlaggerをインストールする方法 Windowsで簡単にPlaggerをインストールする方法 Seacolor's Labs.さんからCustomFeed::Configの最新版をコピペ、Config.pmとして保存 場所は、Plagger/CPAN/lib/perl5/site_perl/Plagger/Plugin/CustomFeed/Config.pm Plagger/assets/plugins/Cu...
IRC を便利に楽しく利用するようになって早1年が経ちましたが、これからも色々な人がどんどん IRC を利用してくれるように Tiarra と mobirc の導入をまとめた記事を書いておこうと思います。 Tiarra はIRC Proxy ソフトで、IRC のチャンネルに入りっぱなしにしておいて、ログをとっておいたり、Tiarra に接続するだけで、登録してあるチャンネルに自動的にJoinしてくれるようにする便利...
これにインスパイヤされて。 C/C++で2進数値を記述 - きまぎらすほしゅの不定記 C/C++では、数値リテラルを次のように、8進数、10進数、16進数の三通りで書き表すことが出来る。 int r8 = 01578; /* octal number */ int r10 = 32768; /* decimal number */ int r16 = 0xFFF; /* hexadecimal number */ しかし、8進数よりもよく使われているであろう、2進数の書き方は仕様に存在しないらしい。 続きを読む
gearman いいよ、と方々で言われている昨今ですが、しかしながら gearman がなんなのかよくわからなかったり、どういう動作をするのかわからなかったり、gearman と TheSchwartz の違いがわからなかったりする方が多いようです。 そのあたりを 6A 以外で brad products を日本一使いこんでると思われる弊社が軽く解説してみようかと。 なぜ JobQueue が必要なのか 1つのプロセスで複数のジョ...
GETでリクエストすると入力フォームを表示し、POSTでリクエストするとクエリー文字列に従ってページを表示するCGIです。 xss2.cgi クエリー文字列にtextとあった場合、Pタグで囲まれたテキストにXSSを引き起こすスクリプトを挿入します。 クエリー文字列にattrとあった場合、Aタグのhref属性にXSSを引き起こすスクリプトを挿入します。 何も指定がない場合は上記のスクリプトをエス...
このサンプル版は最大サイズ制限が 50000 byte となっています。 できるだけ上記のスクリプトをダウンロードしてお使いください。
形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽 出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。 教科書に載っているような基本中の基本ですが、あらためてエッセンスを 簡単な例で解説したいと思います。 目的:キーワード抽出対象テキストから、そのテキストを代表する キーワードを抽出します。TF-IDF という指標を用います。(この値が大 きいほど...
fedora core 5 と worepo を使うと、 Plagger がコマンド一発でサクっと入ります。 使い方は、 1. GPG キーをインポート rpm --import http://pub.woremacx.com/worepo/RPM-WOREPO-GPG-KEY 2. yum をセットアップ wget http://pub.woremacx.com/worepo/fc5/fc5-wo.repo mv fc5-wo.repo /etc/yum.repos.d 3. インストール yum install perl-Plagger おしまい! とてもかんたんでしたね! PerlベストプラクティスDamian Conway クイープ オライリー・ジャパ...
「どう書く?org」へようこそ! このサイトは出されたお題をいかに解くか競い合う、 プログラマのためのコロシアムです。 最新のお題 指定されたフォルダ以下のゴミ掃除 指定したフォルダ以下にある、ファイル名が"~"で終わるファイルを削除するプログラムを作ってください。 指定したフォルダの中にあるフォルダのさらに中にあるファイルも削除の対象です。
この部分がなんとも惜しいような気がしたので書きました。 Milano::Monolog: mod_rewriteでサーバーの負荷が高いときだけリダイレクトする my ($ldavg1, $ldavg2, $ldavg3) = `uptime` =~ /load average:\s+([.0-9]+),\s+([.0-9]+),\s+([.0-9]+)/; BSD::getloadavg CPAN(予地) http://www.dan.co.jp/~dankogai/cpan/BSD-getloadavg-0.01.tar.gz
を使って文字列のハッシュ(ダイジェスト)をチェックし、同一の値を示す部分を重複しているとみなしてレポートしてくれます。つまり、プロジェクト内のコードのコピーペーストを検出するツールとして使えるというわけ。 ためしに Plagger で試してみた結果は rabin.txt のようになりました。プラグインの register_hook や CustomFeed での Feed オブジェクトの生成など、イディオム的...
Plagger は豊富なプラグインですべてを自分好みに料理するフィードアグリゲータです。Bloglines to Gmail な Hack の進化系と言えます。また Perl で書かれています。 http://tsukihito.dip.jp/kpb/archives/2006/06/plagger.html 要約すると Feed ( RSS/ATOM ) を Plagger で処理すると、Gmail だの 新しい Feed だのに変換してくれるというもの。その Plagger での処理は Plug-in として提供されているので、設定さえ書け...
『 試してみた結果http://megalodon.jp/?url=http://thelaughingman.net/static/images/hacked/eb8649c1314cf470336d16f28a9d9ed1.png&date=20070312190730 』