Projekt

Obecné

Profil

Akce

Dokumentace k Solru

Solr cores (jádra)

Jádro files

Toto jádro slouží pouze k ukládání dokumentů. Důležitá pole:
  • pole doc_content - obsah XML souboru v bytech
  • pole img_content - obsah souboru s obrázkem (JPEG nebo PNG) v bytech v Base64
  • pole doc_filename - celé jméno XML souboru včetně přípony
  • pole img_filename - celé jméno souboru s obrázkem včetně přípony

Jádro documents

Do tohoto jádra se ukládají jednotlivé XML soubory po text regionech. Tedy jeden dokument v Solru znamená jeden text region uvnitř XML souboru. Hledání poté probíhá tak, že se vyhledává v poli text_region a příslušné řádky a slova se ze Solru vrací v highlightu.

Důležitá pole:
  • pole doc_filename - celé jméno XML souboru včetně přípony
  • pole img_filename - celé jméno souboru s obrázkem včetně přípony
  • pole text_region - text celého text regionu
  • pole text_region_coords - souřadnice text regionu uložené jako text
  • pole s prefixem text_line_ - text celé řádky (line)
  • pole s prefixem a suffixem text_line_..._coords - souřadnice celé řádky uložené jako text
  • pole s prefixem text_word_ - text slova (word)
  • pole s prefixem a suffixem text_word_..._coords - souřadnice slova uložené jako text

Všechna pole jsou typu text_general. Je možné tento typ změnit v souboru project-root\solr\core-configs\documents\conf\documents_schema.xml při deklaraci daného pole. Například při výměně za typ text_de se postará o to, že Solr pozná, že je text v němčině a vynechá všechna německá stop slova (která jsou v souboru project-root\solr\core-configs\documents\conf\lang\stopwords_de.txt).

Úprava parametrů vyhledávání v Solru

  • soubor: project-root\solr\core-configs\documents\conf\solrconfig.xml
    • tag: <requestHandler name="/select" class="solr.SearchHandler">
      • parametr rows - maximální počet vracených dokumentů
      • parametr spellcheck.count - počet nabízených alternativních slov

Další parametry naleznete zde: https://lucene.apache.org/solr/guide/8_5/the-well-configured-solr-instance.html

Úpravy parametrů Solru a jednotlivých jader lze také provádět v grafickém rozhraní Solru, což může být i pohodlnější. Pokud se úpravy provádějí přímo v souborech, pak je nutné v grafickém rozhraní Solru u příslušného jádra provést RELOAD, aby se nové konfigurace načetly.

Aktualizováno uživatelem Zdeněk Častorál před asi 4 roky(ů) · 11 revizí