Projekt

Obecné

Profil

Dokumentace k Solru » Historie » Revize 8

Revize 7 (Jitka Poubová, 2020-05-13 15:43) → Revize 8/11 (Jitka Poubová, 2020-05-13 16:03)

h1. Dokumentace k Solru 

 h2. Solr cores (jádra) 

 h3. Jádro *files* 

 Toto jádro slouží pouze k ukládání dokumentů. Důležitá pole: 
 * pole *doc_content* - obsah XML souboru v bytech 
 * pole *img_content* - obsah souboru s obrázkem (JPEG nebo PNG) v bytech v Base64 
 * pole *doc_filename* - celé jméno XML souboru včetně přípony 
 * pole *img_filename* - celé jméno souboru s obrázkem včetně přípony 

 h3. Jádro *documents* 

 Do tohoto jádra se ukládají jednotlivé XML soubory po text regionech. Tedy jeden dokument v Solru znamená jeden text region uvnitř XML souboru. Hledání poté probíhá tak, že se vyhledává v poli *text_region* a příslušné řádky a slova se ze Solru vrací v highlightu. 

  

 Důležitá pole: 
 * pole *doc_filename* - celé jméno XML souboru včetně přípony 
 * pole *img_filename* - celé jméno souboru s obrázkem včetně přípony 
 * pole *text_region* - text celého text regionu 
 * pole *text_region_coords* - souřadnice text regionu uložené jako text 
 * pole s prefixem *text_line_* - text celé řádky (line) 
 * pole s prefixem a suffixem *text_line_..._coords* - souřadnice celé řádky uložené jako text 
 * pole s prefixem *text_word_* - text slova (word) 
 * pole s prefixem a suffixem *text_word_..._coords* - souřadnice slova uložené jako text 

 Všechna pole jsou typu *text_general*. Je možné tento typ změnit v souboru _project-root\solr\core-configs\documents\conf\documents_schema.xml_ při deklaraci daného pole. Například při výměně za typ *text_de* se postará o to, že Solr pozná, že je text v němčině a vynechá všechna německá stop slova (která jsou v souboru _project-root\solr\core-configs\documents\conf\lang\stopwords_de.txt_). 

 h2. Úprava parametrů vyhledávání v Solru 

 * soubor: _project-root\solr\core-configs\documents\conf\solrconfig.xml_  
 ** tag: _<requestHandler name="/select" class="solr.SearchHandler">_ 
 *** parametr _rows_ - maximální počet vracených dokumentů 
 *** parametr _spellcheck.count_ - počet nabízených alternativních slov 

 Další parametry naleznete zde: https://lucene.apache.org/solr/guide/8_5/the-well-configured-solr-instance.html