国立国語研究所の構築した日本語話し言葉コーパス(CSJ)のXMLファイルと、 それを読み込んだTamino XMLデータベースサーバを検索するためのツールです。検索言語にはXQueryを使用しました。XMLファイルの検索ライブラリにはQizx/openを使用しました。 原始的ですが、GUIを使用してXQueryを作成することができます。配布DVDには入らないことになったので非公式ツールですが、一応、CSJプロジェクトの成果物の一つです。
作成した条件のXML形式での保存/読込ができるようになりました。
XMLの深さに応じて動的にQueryを生成するようにしたので、生成文の解析が速くなりました。
小さな検索の場合、-Xmx -Xmsを使わなくてもよくなりました。
IPUがルートのDatabaseをサポートしました。
指定したIPUを物干しで開けるようになりました。
始めのn件や、n件目からn件分というように検索を小分けして指定できるようにする。(結果の数が不明なので、ある程度の制限あり)
TaminoとFileとで検索式が異なるので、指定を変更する。
SF.JPプロジェクトに登録しました
ソース(Ankou-latest.tgz)とmanual(Ankou.pdf)と最新のjar(Ankou.jar)があります。Javaが動く環境なら動くはずです。
音声の再生に関して、IBM JREやblackdown JREなど、純正のSun JRE以外で実行した場合、音声ファイルのSearchがうまくいかない事があるようです。 その場合は、Sun JREを使用して下さい。






Q: What's the difference between a duck and an elephant?
A: You can't get down off an elephant.
<krang> Hey all, what's the best way to call one perl script from
another? I was thinking I'd just use 'system("script.pl");'
<dazjorz> krang: yeah, that, or do "script.pl"
<dazjorz> krang: depends on how seperated you want them to be
<krang> dazjorz: you mean just a line that has "script.pl"; written
on it?
<Khisanth> you need the do as well
<dazjorz> krang: no, exactly this: do "script.pl";
<rindolf> krang: system is usually what you want.
<rindolf> krang: normally require or use are preferable to do
<dazjorz> rindolf: that's for modules, isn't it ?
<rindolf> dazjorz: yes.
<dazjorz> wait, I think require "script.pl" would work too
<rindolf> dazjorz: and doing code is not such a good idea.
<dazjorz> rindolf: hmm?
<krang> rindolf: what is doing anyway?
<rindolf> dazjorz: I mean "perldoc -f do"-ing code.
<rindolf> krang: do()-ing
<rindolf> krang: it reads the file and evaluates it.
<rindolf> krang: perldoc -f do.
<dazjorz> rindolf: ah
<dazjorz> rindolf: do {}
* rindolf would rather be doing hot models than doing code.
:-)
<dazjorz> rindolf: yeah, do BLOCK is quite useless
<dazjorz> heh
<rindolf> dazjorz: you can do my $var = do { ... }
* dazjorz would rather be doing GumbyBRAIN than doing code
<GumbyBRAIN> and doing code is not be in the days of immortality!
<rindolf> dazjorz: or eval { ... }
<rindolf> dazjorz: heh.
<rindolf> It's hard to do code.
<dazjorz> do $model;
<dazjorz> eh.. sorry, do $hotmodel;
<rindolf> "Are you into my brother?"
<rindolf> "No I'm totally into Perl."
<krang> ah ok, I see. Thanks guys!
<rindolf> krang: yw.
<dazjorz> heh :-)
<rindolf> If you want a configuration file, you should be using
something like INI, YAML, etc.
<rindolf> XML perhaps.
<rindolf> Something.
<rindolf> Apache-like config.
<dazjorz> Apache-like is very strong but hard to parse, right ?
<dazjorz> Loading and saving configuration never looks good,
especially when it's XML
<dazjorz> the code to load and save is ugly.
-- Sextalk among Perl cultists
-- #perl, Freenode