Namazuによる全文検索
AND検索
ある単語とある単語の両方を含む文書を検索します。検索結果を絞
り込むのに有効です。3つ以上の単語を指定することも可能です。単語と単語の間に and
を挿みます。
例:
Linux and Netscape
and
は省略できます。単語を空白で区切って羅列するとそれらの語すべてを含む文書をAND検索します。
グループ化
AND検索、OR検索、NOT検索を括弧でグループ化できます。括弧の両隣には空白を入れる必要があります。
例:
( Linux or FreeBSD ) and Netscape not Windows
フレイズ検索
2語以上からなる複合語を検索します。 "..."
と2重引用符で、あるいは {...}
と中括弧で囲みます。Namazuのフレイズ検索は精度が 100 % ではないため、ときどき誤ることがあります。
例:
{GNU Emacs}
部分一致検索
部分一致検索には前方一致、中間一致、後方一致の 3種類があります。
- 前方一致検索
inter*
(inter
から始まる単語を含む文書を検索)- 中間一致検索
*text*
(text
を内包する単語を含む文書を検索)- 後方一致検索
*net
(net
で終わる単語を含む文書を検索)
正規表現検索
検索するキーワードを正規表現で指定します。正規表現は /.../
のようにスラッシュ記号で囲みます。正規表現のエンジンにはRubyのコードを利用しています。正規表現の書式はPerlとほぼ同じです。
例:
/インター?フェ[イー]ス/
フィールド指定の検索
Subject:
, From:
,Message-Id:
といったフィールドを指定して検索する手法です。特にMail/News のファイルを扱う際に効果を発揮します。
例:
+subject:Linux
(Subject: にLinux
が含まれる文書)+subject:"GNU Emacs"
(Subject: にGNU Emacs
が含まれる文書)+from:foo@bar.jp
(From: にfoo@bar.jp
が含まれる文書)+message-id:<199801240555.OAA18737@foo.bar.jp>
(Message-Id を指定)
特記事項
- いずれの検索方法でもアルファベットの大文字・小文字の区別はしません。
- 日本語の複合語は形態素単位に分割し、それらを フレイズ検索します。分割は不適切に行なわれることがあります。
- JIS X 0208 (いわゆる全角文字) の英数字と記号の一部 (ASCIIと重複しているもの) は ASCII (いわゆる半角文字) として処理されます。
- 記号を含む語の検索ができます。例:
TCP/IP
。ただし、記号の処理は完全ではないのでTCP and IP
のように分割してAND検索をかけた方が取りこぼしがありません (その代わり余計なファイルまでヒットしてしまう可能性があります)。 - 中間一致・後方一致、正規表現、フィールド指定の検索には少し時間がかかります。
and
,or
,not
を単語として検索したいときはそれぞれ、"..."
と2重引用符で、あるいは{...}
と中括弧で囲みます。
補足
この全文検索システムはNamazu v2.0.21 によって構築されています。