国立国語研究所の構築した日本語話し言葉コーパス(CSJ)のXMLファイルと、 それを読み込んだTamino XMLデータベースサーバを検索するためのツールです。検索言語にはXQueryを使用しました。XMLファイルの検索ライブラリにはQizx/openを使用しました。 原始的ですが、GUIを使用してXQueryを作成することができます。配布DVDには入らないことになったので非公式ツールですが、一応、CSJプロジェクトの成果物の一つです。
作成した条件のXML形式での保存/読込ができるようになりました。
XMLの深さに応じて動的にQueryを生成するようにしたので、生成文の解析が速くなりました。
小さな検索の場合、-Xmx -Xmsを使わなくてもよくなりました。
IPUがルートのDatabaseをサポートしました。
指定したIPUを物干しで開けるようになりました。
始めのn件や、n件目からn件分というように検索を小分けして指定できるようにする。(結果の数が不明なので、ある程度の制限あり)
TaminoとFileとで検索式が異なるので、指定を変更する。
SF.JPプロジェクトに登録しました
ソース(Ankou-latest.tgz)とmanual(Ankou.pdf)と最新のjar(Ankou.jar)があります。Javaが動く環境なら動くはずです。
音声の再生に関して、IBM JREやblackdown JREなど、純正のSun JRE以外で実行した場合、音声ファイルのSearchがうまくいかない事があるようです。 その場合は、Sun JREを使用して下さい。






The very first version of Microsoft Word for Windows was considered a "death
march" project. It took forever. It kept slipping. The whole team was working
ridiculous hours, the project was delayed again, and again, and again, and the
stress was incredible. When the dang thing finally shipped, years late,
Microsoft sent the whole team off to Cancun for a vacation, then sat down for
some serious soul-searching.
What they realized was that the project managers had been so insistent on
keeping to the "schedule" that programmers simply rushed through the coding
process, writing extremely bad code, because the bug fixing phase was not a
part of the formal schedule. There was no attempt to keep the bug-count down.
Quite the opposite. The story goes that one programmer, who had to write the
code to calculate the height of a line of text, simply wrote "return 12;" and
waited for the bug report to come in about how his function is not always
correct. The schedule was merely a checklist of features waiting to be turned
into bugs. In the post-mortem, this was referred to as "infinite defects
methodology".
To correct the problem, Microsoft universally adopted something called a "zero
defects methodology". Many of the programmers in the company giggled, since it
sounded like management thought they could reduce the bug count by executive
fiat. Actually, "zero defects" meant that at any given time, the highest
priority is to eliminate bugs before writing any new code.
-- Joel Spolsky
-- "The Joel Test: 12 Steps to Better Code" ( http://www.joelonsoftware.com/articles/fog0000000043.html )
Q: What's tan and black and looks great on a lawyer?
A: A doberman.