国立国語研究所の構築した日本語話し言葉コーパス(CSJ)のXMLファイルと、 それを読み込んだTamino XMLデータベースサーバを検索するためのツールです。検索言語にはXQueryを使用しました。XMLファイルの検索ライブラリにはQizx/openを使用しました。 原始的ですが、GUIを使用してXQueryを作成することができます。配布DVDには入らないことになったので非公式ツールですが、一応、CSJプロジェクトの成果物の一つです。
作成した条件のXML形式での保存/読込ができるようになりました。
XMLの深さに応じて動的にQueryを生成するようにしたので、生成文の解析が速くなりました。
小さな検索の場合、-Xmx -Xmsを使わなくてもよくなりました。
IPUがルートのDatabaseをサポートしました。
指定したIPUを物干しで開けるようになりました。
始めのn件や、n件目からn件分というように検索を小分けして指定できるようにする。(結果の数が不明なので、ある程度の制限あり)
TaminoとFileとで検索式が異なるので、指定を変更する。
SF.JPプロジェクトに登録しました
ソース(Ankou-latest.tgz)とmanual(Ankou.pdf)と最新のjar(Ankou.jar)があります。Javaが動く環境なら動くはずです。
音声の再生に関して、IBM JREやblackdown JREなど、純正のSun JRE以外で実行した場合、音声ファイルのSearchがうまくいかない事があるようです。 その場合は、Sun JREを使用して下さい。






I'm sexy, I'm cute, I'm popular to boot.
I'm bitchin', great hair, the boys all love to stare!
I'm wanted, I'm hot, I'm everything you're not.
I'm pretty, I'm cool, I dominate this school.
Who am I? Just guess. Guys wanna touch my chest.
I'm rockin', I smile and many think I'm vile.
I'm flying, I jump you can look but don't you hump. Whoo!
I major, I roar. I swear I'm not a whore.
We cheer and we lead - we act like we're on speed.
You hate us cause we're beautiful but we don't like you either.
We're cheerleaders. We are cheerleaders!
Excerpt from "Bring it On"
-- Bring it On (The Original) ( http://en.wikipedia.org/wiki/Bring_It_On_(film) )
Welcome to the Church of the Holy
Cabbage. Lettuce pray...
-- One of Nadav Har'El's Email Signatures.