Projekt

Obecné

Profil

Popis struktury DB » Historie » Verze 11

Ondřej Drtina, 2021-03-26 09:59

1 3 Ondřej Drtina
h1. Úvod
2 4 Ondřej Drtina
3 10 Ondřej Drtina
Zadavatelem byly dodány dvě databáze, jejichž struktura je shodná. Tedy shodují se názvy i počet tabulek, rovněž jsou shodné i typy atributů, kterými dané tabulky disponují. Popis je tedy validní pro obě dodané databáze.
4 4 Ondřej Drtina
5 3 Ondřej Drtina
h1. Dostupné tabulky
6 4 Ondřej Drtina
7 10 Ondřej Drtina
V podkapitolách je uveden obecný popis dat, jež obsahuje tabulka s odpovídajícím názvem.
8 4 Ondřej Drtina
9
h2. dd_wordform
10
11 10 Ondřej Drtina
Uvedenou tabulku lze považovat za výchozí bod pro zobrazení dat uživateli. Obsahuje slovní tvar, datum vytvoření záznamu a poznámky přiřazené k jednotlivým záznamům vytvořené zadavatelkami. Rovněž se v tabulce nachází cizí klíče, které zajistí přiřazení lemmatu a morfologické charakteristiky k příslušnému slovnímu tvaru.
12 4 Ondřej Drtina
13 1 Ondřej Drtina
h2. dd_lemma
14 4 Ondřej Drtina
15 10 Ondřej Drtina
Obsahuje slova v základním tvaru.
16 4 Ondřej Drtina
17 1 Ondřej Drtina
h2. dd_tag
18 4 Ondřej Drtina
19 10 Ondřej Drtina
Obsahuje morfologickou charakteristiku pro slovní tvary. Charakteristika je v kódovém označení, které je blíže popsáno v kapitole pojednávající o atributech přítomných v tabulkách.
20 4 Ondřej Drtina
21
h2. dd_manuscript
22 1 Ondřej Drtina
23 10 Ondřej Drtina
Jedná se o spojovací tabulku vyjadřující relaci M:N zajišťující přiřazení textového pramenu k slovnímu tvaru. Jeden slovní tvar se může nacházet ve více pramenech a zároveň jeden pramen může obsahovat více slovních tvarů. Seznam pramenů je dostupný v kapitole popisující atributy.
24 4 Ondřej Drtina
25 6 Ondřej Drtina
h1. Atributy tabulek
26
27 4 Ondřej Drtina
Předmětem kapitoly je detailní popis atributů a jejich významu v dané tabulce. V seznamu atributů není uvedena položka "id", kterou obsahují všechny uvedené tabulky vyjma "dd_manuscript", jelikož její význam je shodný napříč tabulkami. Atribut "id" je hodnotou, která je pro každou položku tabulky odlišná. Id je inkrementováno obvyklým způsobem, tedy pokud má poslední vložený záznam id n, nově vložený záznam bude mít n + 1.
28 10 Ondřej Drtina
29
Pokud je u atributu uveden příklad, pak se vztahuje ke slovnímu tvaru "žehnává" ("id"=26228 v tabulce "dd_wordform").
30 4 Ondřej Drtina
31
h2. dd_wordform
32 1 Ondřej Drtina
33 6 Ondřej Drtina
h3. context
34
35 11 Ondřej Drtina
Typ atributu: character varying (20)
36
37 7 Ondřej Drtina
//TODO: předložka?
38
39 1 Ondřej Drtina
h3. date
40
41 11 Ondřej Drtina
Typ atributu: timestamp without time zone
42
43 4 Ondřej Drtina
Datum vytvoření příslušného záznamu ve formátu rrrr-mm-dd, kde r = rok, m = měsíc, d = den. Položky mají rovněž přiřazený i čas, který však zřejmě nikdy nebyl zadán - u všech položek je tedy 00:00:00.
44 1 Ondřej Drtina
45 11 Ondřej Drtina
h3. description
46 1 Ondřej Drtina
47 11 Ondřej Drtina
Typ atributu: character varying (250)
48
49 7 Ondřej Drtina
//TODO: líp spec. Poznámka uživatelek, blíže nespecifikovaný význam. V dodaném SW popsáno jako "Poznámka1".
50
51 3 Ondřej Drtina
h3. description2
52 1 Ondřej Drtina
53 11 Ondřej Drtina
Typ atributu: character varying (250)
54
55 7 Ondřej Drtina
//TODO: líp spec. Poznámka uživatelek, blíže nespecifikovaný význam. V dodaném SW popsáno jako "Poznámka2".
56
57 3 Ondřej Drtina
h3. description3
58 1 Ondřej Drtina
59 11 Ondřej Drtina
Typ atributu: character varying (250)
60
61 7 Ondřej Drtina
//TODO: líp spec. Poznámka uživatelek, blíže nespecifikovaný význam. V dodaném SW popsáno jako "Poznámka3".
62
63 3 Ondřej Drtina
h3. ending
64 1 Ondřej Drtina
65 11 Ondřej Drtina
Typ atributu: character varying (10)
66
67 7 Ondřej Drtina
Koncovka příslušného slovního tvaru. Příklad: když word = "Albrechta", pak ending = "a".
68
69 3 Ondřej Drtina
h3. finished
70 1 Ondřej Drtina
71 11 Ondřej Drtina
Typ atributu: boolean
72
73 7 Ondřej Drtina
Vyjadřuje, zda již bylo zpracování daného slovního tvaru zcela dokončeno či nikoliv. Atribut tak nabývá hodnoty "true", respektive "false".
74
75 3 Ondřej Drtina
h3. namedentity
76 1 Ondřej Drtina
77 11 Ondřej Drtina
Typ atributu: integer
78
79 7 Ondřej Drtina
//TODO: líp spec. Význam atributu neznámý, není vyobrazen v dodaném SW. V první dodané databázi nabývá hodnot 0 a 1, v druhé databázi nabývá pouze hodnoty 0.
80
81 3 Ondřej Drtina
h3. position1
82 1 Ondřej Drtina
83 11 Ondřej Drtina
Typ atributu: character varying (10)
84
85 7 Ondřej Drtina
Číslo kapitoly v textovém pramenu, z něhož byl slovní tvar získán. V dodaném SW zobrazeno jako hodnota "Pozice" před lomítkem.
86
87 3 Ondřej Drtina
h3. position2
88 1 Ondřej Drtina
89 11 Ondřej Drtina
Typ atributu: character varying (10)
90
91 7 Ondřej Drtina
Číslo verše v textovém pramenu, z něhož byl slovní tvar získán. V dodaném SW zobrazeno jako hodnota "Pozice" za lomítkem.
92
93 1 Ondřej Drtina
h3. positiondetail
94
95 11 Ondřej Drtina
Typ atributu: character varying (10)
96
97 7 Ondřej Drtina
//TODO: zeptat se, netuším. V dodaném SW není umožněno zobrazení hodnoty daného atributu.
98
99 3 Ondřej Drtina
h3. prefix
100 1 Ondřej Drtina
101 11 Ondřej Drtina
Typ atributu: character varying (10)
102
103 8 Ondřej Drtina
Atribut vyjadřuje předponu slova. V první databázi u menšiny položek má přidělenou hodnotu, v druhé databázi není hodnota dostupná u žádné z položek. Dodaný SW neumožňuje zobrazit hodnotu daného atributu.
104 4 Ondřej Drtina
105 1 Ondřej Drtina
h3. suffix
106
107 11 Ondřej Drtina
Typ atributu: character varying (10)
108
109 8 Ondřej Drtina
Jedná se o příponu slovního tvaru. V první databázi má atribut přidělenou hodnotu u menšiny položek, v druhé databázi není danému atributu přidělena hodnota u žádné položky. Dodaný SW neumožňuje zobrazit hodnotu daného atributu.
110
111 1 Ondřej Drtina
h3. word
112
113 11 Ondřej Drtina
Typ atributu: character varying (50)
114
115 8 Ondřej Drtina
Samotný slovní tvar, ke kterému je vázán zbytek popsaných atributů.
116
117 1 Ondřej Drtina
h3. lemma_id
118
119 11 Ondřej Drtina
Typ atributu: bigint
120
121 8 Ondřej Drtina
Cizí klíč, odkaz do tabulky dd_lemma. Pro vyhledání odpovídajícího lemmatu ke slovnímu tvaru je potřeba vyhledat hodnotu atributu "lemma_id", který je u příslušného slovního tvaru, ve sloupci "id" v tabulce "dd_lemma".
122
123 1 Ondřej Drtina
h3. tag_id
124
125 11 Ondřej Drtina
Typ atributu: bigint
126
127 8 Ondřej Drtina
Cizí klíč, odkaz do tabulky dd_tag. Pro přiřazení odpovídající morfologické charakteristiky ke slovnímu tvaru je potřeba najít hodnotu atributu "tag_id", který je u příslušného slovního tvaru, ve sloupci "id" v tabulce "dd_tag".
128
129 1 Ondřej Drtina
h2. dd_lemma
130 4 Ondřej Drtina
131 3 Ondřej Drtina
h3. lemma
132 1 Ondřej Drtina
133 11 Ondřej Drtina
Typ atributu: character varying (50)
134
135 8 Ondřej Drtina
Slovo v základním tvaru, maximálně 50 znaků.
136
137 1 Ondřej Drtina
h3. pos
138
139 11 Ondřej Drtina
Typ atributu: integer
140
141 8 Ondřej Drtina
//TODO: zeptat se, netuším. Charakterizuje pozici lemmatu v textu. Jedno lemma se může vyskytovat na různých pozicích, tedy mít různou hodnotu atributu "pos".
142
143 1 Ondřej Drtina
h2. dd_tag
144 4 Ondřej Drtina
145 1 Ondřej Drtina
h3. tag
146
147 11 Ondřej Drtina
Typ atributu: character varying (20)
148
149 8 Ondřej Drtina
//TODO: zeptat se na zkratky.. Morfologická charakteristika slova, kódově označena.
150
151 4 Ondřej Drtina
h2. dd_manuscript
152
153
h3. wordform_id
154 1 Ondřej Drtina
155 11 Ondřej Drtina
Typ atributu: bigint
156
157 8 Ondřej Drtina
Hodnota tohoto atributu se vždy vyskytuje ve sloupci "id" v tabulce "dd_wordform".
158
159 1 Ondřej Drtina
h3. manuscript
160 11 Ondřej Drtina
161
Typ atributu: integer
162 8 Ondřej Drtina
163
Číslo textového pramenu, ve kterém se slovní tvar nachází. Prameny jsou číslovány od 0, celkově jich je 16. Atribut tedy v dodané DB nabývá hodnot 0-15, kde číslo označuje:
164 9 Ondřej Drtina
> 0 - rukopis Vídeňský
165
> 1 - zlomky Hanušovy
166
> 2 - zlomky Hradecké
167 8 Ondřej Drtina
> 3 - rukopis Cambridžský
168
> 4 - rukopis Františkánský
169 9 Ondřej Drtina
> 5 - zlomek Olomoucký
170
> 6 - fragment Strahovský
171
> 7 - zlomky Klementinsko-Křižovnické
172
> 8 - zlomky Mnichovské
173
> 9 - rukopis Lobkovický
174
> 10 - rukopis Pelclův
175 8 Ondřej Drtina
> 11 - rukopis Cerronský
176 9 Ondřej Drtina
> 12 - rukopis Fürstenberský
177
> 13 - rukopis Zebererův
178
> 14 - vydání Pavla Ješína z Bezdězi, Praha 1620
179
> 15 - básně připsané při Pulkavově kronice v rukopisu Litoměřickém