Projekt

Obecné

Profil

Vize projektu » Historie » Verze 17

Jan Smolař, 2020-03-17 10:28

1 1 Jan Smolař
h1. Vize projektu
2
3 4 Jan Smolař
4
5 3 Jan Smolař
h2. Cíl projektu
6
7 6 Jan Smolař
Projekt má za cíl vytvořit plně funkční webovou aplikaci pro fulltextové vyhledávání v historických obrazových dokumentech. Vytvořená aplikace bude vyvíjena podle potřeb zákazníka a jeho specifických požadavků. Webová aplikace bude pro zákazníka dalším krokem v jeho projektu pro zpracování obrazových dokumentů.  Vstupní data pro tuto aplikaci budou pocházet z OCR systému, který je vytvářen zákazníkem, a vytváří soubory formátu XML z obrazových dokumentů. Projekt bude umožní zákazníkovi ve vytvořených XML dokumentech vyhledávat a výsledky vyhledávání přehledně zobrazovat v původních obrazových dokumentech.
8 17 Jan Smolař
9 16 Jan Smolař
Webová aplikace bude využívána historiky, archiváři a dalšími profesemi jimi podobnými. Umožní vyhledávání v historických dokumentech, které nemají digitální formu, a tím výrazně zrychlí vyhledávání specifických údajů v těchto dokumentech. Po nahrání všech dokumentů archivu či knihovny se vyhledávání údajů zkrátí z několika hodin či dní na pár vteřin. Výsledek vyhledávání bude obsahovat název dokumentu, stranu a odstavec, kde se hledaný výraz nalézá a tím bude následně možné originální dokument či knihu fyzicky dohledat.
10 3 Jan Smolař
11 14 Jan Smolař
h2. Stakeholders
12 1 Jan Smolař
13 6 Jan Smolař
Vývojový tým:
14
* Ondřej Váně
15
* Jan Smolař
16
* Zdeněk Častorál
17
* Jitka Poubová
18
19
Zákazník:
20
* Doc. Ing. Pavel Král, Ph.D.
21
* Ing. Ladislav Lenc, Ph.D.
22
* Ing. Jiří Martínek
23
24
Mentor:
25
* Ing. Petr Pícha
26 3 Jan Smolař
27
h2. Funkční požadavky
28
29 7 Jan Smolař
* možnost nahrát XML dokument spolu s obrazových vzorem do systému
30
* systém provede zpracování a indexaci nově nahraných XML dokumentů
31 8 Jan Smolař
* vyhledat výraz v uložených dokumentech
32
* zobrazení výsledků vyhledávání
33 3 Jan Smolař
34 1 Jan Smolař
h2. Mimofunkční požadavky
35
36 8 Jan Smolař
* odezva systému bude menší než 1 sekunda
37
* systém nebude shromažďovat žádné osobní údaje o uživatelích
38
* systém bude uživatelsky přívětivý, tedy každý uživatel se dokáže v GUI rychle zorientovat
39
* GUI výsledku vyhledávání bude při větším počtu výskytů výsledek vyhledávání rozdělovat na více stránek, tedy systém bude podporovat funkci stránkování
40
* kód bude přehledný (odsazování, způsob pojmenování tříd a metod)
41 3 Jan Smolař
42 9 Jan Smolař
h2. Rizika projektu
43 1 Jan Smolař
44 11 Jan Smolař
* technologie požadovaná zákazníkem Apache Solr nebude použitelná kvůli závažným nedostatkům
45 12 Jan Smolař
** Odstranění - použití jiné technologie
46
47 13 Jan Smolař
* úprava vyhledávání pro cizí jazyk nebude možná
48
** Odstranění - (částečná) implementace této funkcionality jako součást projektu