全文検索サーバ: FESS ― 2023/12/13 20:33
資料探しで難儀をしたので、全文検索システムを試している。
日経Linuxを参考にしてFESS docker版を使ったら、環境構築は楽だったが、色々と悩んだのでメモとして残す。
FESSを起動するとメモリ使用量が+3GBとなり、ビックリした。 テストマシンの主記憶は16GBなので、深く考えず、資料を格納しているフォルダのクロールに進む。
クロールは深夜にスケジュールしたが、コンテナ内のOS環境の標準タイムゾーンがUTCのため、日中に動き出して焦る。メモリ使用量は更に+2.5GB増えたが気にしない。
ブラウザからFESSにアクセスして検索したら、ファイル名に検索語を含むファイルもヒットしてウザい。 そのファイルは生データだったので、 特定の拡張子をクロールの対象外にすれば良いのだが、除外指定が「クロール対象」ではなく「検索対象」を設定する必要があって??になる。 フォーラムを読むまで気付かなかった。
で、検索結果をクリックしたらファイルのダウンロードが始まって、ビックリした。ブラウザ内で(例えば)TEXTファイル表示できない! 公式の解説によると「セキュリティを考慮してデスクトップ検索機能はOFF!」だそうだ。 公式の対策は、変更すべきファイルがコンテナ内に見付からず。別の対策を試して、設定変更したコンテナイメージを保存したが、カイゼンせず(設定ファイルの保存場所が違ってたのが原因?かも)。このままだと、自分の利用イメージに合わず悩ましい。
あとサジェスト機能も微妙。CONTESTを検索したら(下位の方だけど)CONTENTS,CONNECTが含まれるファイルが表示されて、更に悩ましい。
本日の衛星: ISS-FMで交信。HADES-Dを受信、Followed NORAD ID=58567が指定されてTLEが合ってきた感じ。
コメント
トラックバック
このエントリのトラックバックURL: http://jh4xsy.asablo.jp/blog/2023/12/13/9642432/tb
コメントをどうぞ
※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。