/usr/share/groonga/examples/dictionary/readme.txt is in groonga-examples 6.0.1-1ubuntu1.
This file is owned by root:root, with mode 0o644.
The actual contents of the file can be viewed below.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 | .. highlightlang:: none
辞書検索ツール
==============
名前
----
groonga辞書検索ツール
説明
----
様々な商用・非商用の辞書ファイルをインポートしてgroongaで検索できるようにします。
対応している辞書
++++++++++++++++
現状では下記の辞書に対応しています。
* EDICT
EDICTは、Monash大学Jim Breen教授が提供している和英辞書です。下記から入手できます。
http://ftp.monash.edu.au/pub/nihongo/edict.gz
* GENE95
GENE95は、Kurumiさん(NiftyID: GGD00145)が作成された英和辞書です。下記から入手できます。
http://www.namazu.org/~tsuchiya/sdic/data/gene95.tar.gz
* 英辞郎
英辞郎は、EDPという団体によって編纂されている英和・和英辞書です。
http://www.eijiro.jp/
書店やオンラインショップなどで購入できます。
データベースの初期化
++++++++++++++++++++
本ディレクトリで下記のように実行し、辞書データを格納するデータベースファイルを下記のようにして初期化します。
./init-db.sh データベースパス名
このようにして作成したデータベースについて、様々な辞書のデータをインポートすることができます。
インポートの方法
++++++++++++++++
* EDICT
edictディレクトリ配下で以下のように実行します。 edict.gzは自動でダウンロードします。
./edict-import.sh データベースパス名
* GENE95
gene95ディレクトリ配下で下記のように実行します。 gene95.tar.gzは自動でダウンロードします。
./gene-import.sh データベースパス名
* 英辞郎
英辞郎に付属のPDICツールを用いてCSVファイル形式に辞書をエクスポートします。(このとき「登録項目」ですべての項目を出力するようにします) eijiroディレクトリ配下で下記のように実行します。
./eijiro-import.sh データベースパス名 出力したCSVファイルのパス名
(英辞郎第四版で動作を確認しています)
|