私は静的なウェブサイトをインデックスする検索エンジンを自主的にホストしたいと思う。
私はこれらのサイトにCMS(通常は検索エンジンが組み込まれています)を使いたくないので、訪問者をサードパーティの検索エンジンサービスに紹介したくありません。
ユーザーフレンドリーな検索エンジン(Google、Bingなど)である必要はなく、主にパワーユーザー向けです。複雑な検索構文が必要な場合があります。
要件
形式:
バックエンド:
-
検索エンジンはHTML5のインデックスを作成する必要があります(X)。他のフォーマットのサポートは必要ありません。
-
クローラが自分のページを自分自身で見つけることは望ましくありません。代わりに、クロールする必要があるURLのリストを提供したいと思います( sitemaps.orgの形式)。
-
ドキュメントに関するメタデータをドキュメント自体以外の場所に追加することは望ましくありません。
フロントエンド:
- 検索エンジンにはJavaScriptは必要ありません(オプション機能を除く)。
- Cookieを設定してはいけません(ユーザーが設定フォームなどを明示的に提出しない限り)。
私の願い事リスト
インデックス作成:フルテキストに加えて、メタタグやRDFa/JSONなど、可能な限り多くの信号(例:名前と値のペアの形式) -LD、意味要素など
-
SERP:インデックスデータに応じて、結果をどのように表示するかを定義できます。 Googleのリッチスニペットに似ています。たとえば、画像、リスト、ショートテーブルなどを表示します。
-
ランキング:ランキングアルゴリズムを微調整できます。
-
検索演算子:少なくともブール値 AND
/ OR
/ NOT
をサポートする必要があります。 >と括弧(例:(ラップトップORノートブック)(レビューORレビュー)-netbook
)。演算子が多いほど、フレーズ/レンジ/近接検索、フィールドベース検索、特殊文字、大文字小文字の区別など)