全文検索はRecollに戻る ― 2023/12/24 16:01

全文検索システム:Fessを諦めて、Recollに戻った。 ネット情報は少ないが、文書ファイル+メールの検索&プレビュー表示が可能で、ステキです(添付画像、参照)。
検索は画像ファイルも対象にできるが、インデックスされた画像は(何故か)少ない。例えばDX局のコールサインで検索したら受領したeQSLカードはヒットしない.と(自分的には)程よいSNR感。
検索INDEXの作成にあたっては、前回の教訓を活かして、各種の生ファイルを対象外(skippedNames)に指定した。 INDEX対象に$HOMEを指定したら、 INDEX作成は短時間で終了したが、日々の更新はcrontabで夜間にスケジュール化している。
検索はCUIからも可能と判ったが、(下記の通り)ファイル名の表示+ヒットした文章の前後の表示だけで、プレビューが不可なので使わないかも。
$ recoll -t -q "ポールジロー ジュース" :3:common/rclinit.cpp:391::Recoll 1.36.2 + Xapian 1.4.17 [/home/jh4xsy/.recoll] Recoll query: Query10 * (ポー PHRASE 5 ルジ PHRASE 5 ロー) AND 10 * (ジュ PHRASE 3 ース ) 27 results message/rfc822 [file:///home/jh4xsy/.thunderbird/...] [■■ポールジロージュース...] 5668 bytes message/rfc822 [file:///home/jh4xsy/.thunderbird/...] [...ーズデビュー!ポールジロジュースも再...] 24721 bytes message/rfc822 [file:///home/jh4xsy/.thunderbird/...] [OMC10周年記念ラフロイグ!ポールジロ...] 25731 bytes ...
本日の衛星: RS-44で交信。
CaribouLite #8 ― 2023/12/18 09:02
ラズパイ HATなSDR: Cariboulite、 12月になってソフト更新あり。 インストール手順書の見直しがメインで、ドライバにアップデートは無かった。
APIの互換性からSoapySDRはパッケージ版ではなく最新版をbuildして使うのが吉らしいが、最新版でcaribou_dump1090を試したが、動作が安定しない。 起動時にSMI reading operation failed や violated memory access permissions が発生する確率が上がった気がする。
以前にブログで書いたSDR側で「Invert IQが必要」な件は、issueに挙がった。 複数のSDRで発生しており問題はSoapySDRっぽいが、開発者からレスが付かない。 開発者の住むイスラエルはいま戦争中なので仕方がないかも。
本日の衛星: ISSのSSTVを待つが、送信なし。
全文検索サーバ: FESS ― 2023/12/13 20:33
資料探しで難儀をしたので、全文検索システムを試している。
日経Linuxを参考にしてFESS docker版を使ったら、環境構築は楽だったが、色々と悩んだのでメモとして残す。
FESSを起動するとメモリ使用量が+3GBとなり、ビックリした。 テストマシンの主記憶は16GBなので、深く考えず、資料を格納しているフォルダのクロールに進む。
クロールは深夜にスケジュールしたが、コンテナ内のOS環境の標準タイムゾーンがUTCのため、日中に動き出して焦る。メモリ使用量は更に+2.5GB増えたが気にしない。
ブラウザからFESSにアクセスして検索したら、ファイル名に検索語を含むファイルもヒットしてウザい。 そのファイルは生データだったので、 特定の拡張子をクロールの対象外にすれば良いのだが、除外指定が「クロール対象」ではなく「検索対象」を設定する必要があって??になる。 フォーラムを読むまで気付かなかった。
で、検索結果をクリックしたらファイルのダウンロードが始まって、ビックリした。ブラウザ内で(例えば)TEXTファイル表示できない! 公式の解説によると「セキュリティを考慮してデスクトップ検索機能はOFF!」だそうだ。 公式の対策は、変更すべきファイルがコンテナ内に見付からず。別の対策を試して、設定変更したコンテナイメージを保存したが、カイゼンせず(設定ファイルの保存場所が違ってたのが原因?かも)。このままだと、自分の利用イメージに合わず悩ましい。
あとサジェスト機能も微妙。CONTESTを検索したら(下位の方だけど)CONTENTS,CONNECTが含まれるファイルが表示されて、更に悩ましい。
本日の衛星: ISS-FMで交信。HADES-Dを受信、Followed NORAD ID=58567が指定されてTLEが合ってきた感じ。
CaribouLite #7 ― 2023/10/09 09:19
SDR: Cariboulite、 約3ヶ月ぶりにソフト更新あり。timeout issue対応があったが、 satnogs-clientから利用するとtimeoutが止まらない。
プロジェクトの進展はSMIエラーの原因が判明したことくらい。 HATで使うGPIOのポートがSMI/シリアルポートと共用で、config.txtで enable_uart=0 と設定する必要があるそうだ。 自分はシリアルポートを最初に無効化したので、影響なし。
気分転換に、SMIエラーのissueで言及された(exampleフォルダにある)caribou_dump1090を試したら、SMIエラーはゼロだがデコードせず。 同じアンテナでもRTLSDR+dump1090-faではデコードできるので、何だかな...
最近のコメント