全文検索サーバ: FESS2023/12/13 20:33

資料探しで難儀をしたので、全文検索システムを試している。

日経Linuxを参考にしてFESS docker版を使ったら、環境構築は楽だったが、色々と悩んだのでメモとして残す。

FESSを起動するとメモリ使用量が+3GBとなり、ビックリした。 テストマシンの主記憶は16GBなので、深く考えず、資料を格納しているフォルダのクロールに進む。

クロールは深夜にスケジュールしたが、コンテナ内のOS環境の標準タイムゾーンがUTCのため、日中に動き出して焦る。メモリ使用量は更に+2.5GB増えたが気にしない。

ブラウザからFESSにアクセスして検索したら、ファイル名に検索語を含むファイルもヒットしてウザい。 そのファイルは生データだったので、 特定の拡張子をクロールの対象外にすれば良いのだが、除外指定が「クロール対象」ではなく「検索対象」を設定する必要があって??になる。 フォーラムを読むまで気付かなかった。

で、検索結果をクリックしたらファイルのダウンロードが始まって、ビックリした。ブラウザ内で(例えば)TEXTファイル表示できない! 公式の解説によると「セキュリティを考慮してデスクトップ検索機能はOFF!」だそうだ。 公式の対策は、変更すべきファイルがコンテナ内に見付からず。別の対策を試して、設定変更したコンテナイメージを保存したが、カイゼンせず(設定ファイルの保存場所が違ってたのが原因?かも)。このままだと、自分の利用イメージに合わず悩ましい。

あとサジェスト機能も微妙。CONTESTを検索したら(下位の方だけど)CONTENTS,CONNECTが含まれるファイルが表示されて、更に悩ましい。

本日の衛星: ISS-FMで交信。HADES-Dを受信、Followed NORAD ID=58567が指定されてTLEが合ってきた感じ。

コメント

コメントをどうぞ

※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。

名前:
メールアドレス:
URL:
コメント:

トラックバック

このエントリのトラックバックURL: http://jh4xsy.asablo.jp/blog/2023/12/13/9642432/tb