Projekt

Obecné

Profil

Dokumentace k Solru » Historie » Verze 8

Jitka Poubová, 2020-05-13 16:03

1 6 Jitka Poubová
h1. Dokumentace k Solru
2 2 Jitka Poubová
3 7 Jitka Poubová
h2. Solr cores (jádra)
4
5
h3. Jádro *files*
6
7
Toto jádro slouží pouze k ukládání dokumentů. Důležitá pole:
8
* pole *doc_content* - obsah XML souboru v bytech
9
* pole *img_content* - obsah souboru s obrázkem (JPEG nebo PNG) v bytech v Base64
10
* pole *doc_filename* - celé jméno XML souboru včetně přípony
11
* pole *img_filename* - celé jméno souboru s obrázkem včetně přípony
12
13
h3. Jádro *documents*
14
15 8 Jitka Poubová
Do tohoto jádra se ukládají jednotlivé XML soubory po text regionech. Tedy jeden dokument v Solru znamená jeden text region uvnitř XML souboru. Hledání poté probíhá tak, že se vyhledává v poli *text_region* a příslušné řádky a slova se ze Solru vrací v highlightu.
16 7 Jitka Poubová
17
Důležitá pole:
18
* pole *doc_filename* - celé jméno XML souboru včetně přípony
19
* pole *img_filename* - celé jméno souboru s obrázkem včetně přípony
20
* pole *text_region* - text celého text regionu
21
* pole *text_region_coords* - souřadnice text regionu uložené jako text
22
* pole s prefixem *text_line_* - text celé řádky (line)
23
* pole s prefixem a suffixem *text_line_..._coords* - souřadnice celé řádky uložené jako text
24
* pole s prefixem *text_word_* - text slova (word)
25 1 Jitka Poubová
* pole s prefixem a suffixem *text_word_..._coords* - souřadnice slova uložené jako text
26 8 Jitka Poubová
27
Všechna pole jsou typu *text_general*. Je možné tento typ změnit v souboru _project-root\solr\core-configs\documents\conf\documents_schema.xml_ při deklaraci daného pole. Například při výměně za typ *text_de* se postará o to, že Solr pozná, že je text v němčině a vynechá všechna německá stop slova (která jsou v souboru _project-root\solr\core-configs\documents\conf\lang\stopwords_de.txt_).
28 7 Jitka Poubová
29 3 Jitka Poubová
h2. Úprava parametrů vyhledávání v Solru
30
31
* soubor: _project-root\solr\core-configs\documents\conf\solrconfig.xml_ 
32 4 Jitka Poubová
** tag: _<requestHandler name="/select" class="solr.SearchHandler">_
33
*** parametr _rows_ - maximální počet vracených dokumentů
34
*** parametr _spellcheck.count_ - počet nabízených alternativních slov
35 5 Jitka Poubová
36
Další parametry naleznete zde: https://lucene.apache.org/solr/guide/8_5/the-well-configured-solr-instance.html