Dokumentace k Solru¶
Solr cores (jádra)¶
Jádro files¶
Toto jádro slouží pouze k ukládání dokumentů. Důležitá pole:- pole doc_content - obsah XML souboru v bytech
- pole img_content - obsah souboru s obrázkem (JPEG nebo PNG) v bytech v Base64
- pole doc_filename - celé jméno XML souboru včetně přípony
- pole img_filename - celé jméno souboru s obrázkem včetně přípony
Jádro documents¶
Do tohoto jádra se ukládají jednotlivé XML soubory po text regionech. Tedy jeden dokument v Solru znamená jeden text region uvnitř XML souboru. Hledání poté probíhá tak, že se vyhledává v poli text_region a příslušné řádky a slova se ze Solru vrací v highlightu.
Důležitá pole:- pole doc_filename - celé jméno XML souboru včetně přípony
- pole img_filename - celé jméno souboru s obrázkem včetně přípony
- pole text_region - text celého text regionu
- pole text_region_coords - souřadnice text regionu uložené jako text
- pole s prefixem text_line_ - text celé řádky (line)
- pole s prefixem a suffixem text_line_..._coords - souřadnice celé řádky uložené jako text
- pole s prefixem text_word_ - text slova (word)
- pole s prefixem a suffixem text_word_..._coords - souřadnice slova uložené jako text
Všechna pole jsou typu text_general. Je možné tento typ změnit v souboru project-root\solr\core-configs\documents\conf\documents_schema.xml při deklaraci daného pole. Například při výměně za typ text_de se postará o to, že Solr pozná, že je text v němčině a vynechá všechna německá stop slova (která jsou v souboru project-root\solr\core-configs\documents\conf\lang\stopwords_de.txt).
Úprava parametrů vyhledávání v Solru¶
- soubor: project-root\solr\core-configs\documents\conf\solrconfig.xml
- tag: <requestHandler name="/select" class="solr.SearchHandler">
- parametr rows - maximální počet vracených dokumentů
- parametr spellcheck.count - počet nabízených alternativních slov
- tag: <requestHandler name="/select" class="solr.SearchHandler">
Další parametry naleznete zde: https://lucene.apache.org/solr/guide/8_5/the-well-configured-solr-instance.html
Úpravy parametrů Solru a jednotlivých jader lze také provádět v grafickém rozhraní Solru, což může být i pohodlnější. Pokud se úpravy provádějí přímo v souborech, pak je nutné v grafickém rozhraní Solru u příslušného jádra provést RELOAD, aby se nové konfigurace načetly.
Aktualizováno uživatelem Zdeněk Častorál před téměř 5 roky(ů) · 11 revizí