/modules/crawler/prepare_new_dataset.py - Diff - Aplikace nad otevřenými daty (KIV) – BHVS - Redmine

« Předchozí | Další »

Revize 2f227a6c

Přidáno uživatelem Tomáš Ballák před více než 3 roky(ů)

ID 2f227a6c1e1ffb03eac822931e0576a9fef25bb6
Rodič 5b7675dd
Potomek d5a88af0

Feature Re #8156 show all datasets

     PROCESSOR_PROGRAM_PATH = "DatasetProcessing"
     # Path to dataset configuration files
     CONFIG_FILES_PATH = "DatasetConfigs"
     # Default color for visualization of dataset (buble info in map)
     DEFAULT_COLOR = "#000000"
     def create_default_config_file(dataset_name):
     def create_default_config_file(dataset_name: str):
         """
         Creates default config file
-...
         with open(CONFIG_FILES_PATH + "/" + dataset_name + ".yaml", "w") as file:
             file.write("# jmeno datasetu, pod kterym bude zobrazen v aplikaci\n")
             file.write("display-name: " + dataset_name + "\n")
             file.write("# jednoslovný název datasetu, pod kterym bude reprezentovana v architektuře\n")
             file.write(
                 "# jednoslovný název datasetu, pod kterym bude reprezentovana v architektuře\n")
             file.write("display-color: " + DEFAULT_COLOR + "\n")
             file.write(
                 "# barva pro tento dataset v hexadecimální hodnotě (#000000)\n")
             file.write("dataset-name: " + dataset_name + "\n")
             file.write("# root slozka, ktera obsahuje odkazy na dataset\n")
             file.write("url: ZDE VLOZTE URL\n")
             file.write("# volitelny parameter, ktery specifikuje vzor jmrna datasetu, ktera se budou stahovat\n")
             file.write(
                 "# volitelny parameter, ktery specifikuje vzor jmrna datasetu, ktera se budou stahovat\n")
             file.write("regex: ZDE VLOZTE REGEX\n")
             file.write("# volitelny parametr, ktery udava jak casto se budou hledat nove datasety, pokud prazdne, "
                        "tak defaultni hodnota (dny)\n")
-...
             file.write("\n")
             file.write("def process_file(filename):\n")
             file.write("    \"\"\"\n")
             file.write("    Method that take path to crawled file and outputs date dictionary:\n")
             file.write("    Date dictionary is a dictionary where keys are dates in format YYYY-mm-dd-hh (2018-04-08-15)\n")
             file.write("    and value is dictionary where keys are devices (specified in configuration file)\n")
             file.write("    and value is CSVDataLine.csv_data_line with device,date and occurrence\n")
             file.write(
                 "    Method that take path to crawled file and outputs date dictionary:\n")
             file.write(
                 "    Date dictionary is a dictionary where keys are dates in format YYYY-mm-dd-hh (2018-04-08-15)\n")
             file.write(
                 "    and value is dictionary where keys are devices (specified in configuration file)\n")
             file.write(
                 "    and value is CSVDataLine.csv_data_line with device,date and occurrence\n")
             file.write("\n")
             file.write("    Args:\n")
             file.write("    filename: name of processed file\n")
-...
             file.write("    date_dict = dict()\n")
             file.write("\n")
             file.write("    #with open(filename, \"r\") as file:\n")
             file.write("    print(\"You must implements process_file method first!\")\n")
             file.write(
                 "    print(\"You must implements process_file method first!\")\n")
             file.write("    return None\n")
-...
             file.write("\n")
             file.write("def crawl(config):\n")
             file.write("    \"\"\"\n")
             file.write("    Implement crawl method that downloads new data to path_for_files\n")
             file.write(
                 "    Implement crawl method that downloads new data to path_for_files\n")
             file.write("    For keeping the project structure\n")
             file.write("    url , regex, and dataset_name from config\n")
             file.write("    You can use already implemented functions from Utilities/Crawler/BasicCrawlerFunctions.py\n")
             file.write(
                 "    You can use already implemented functions from Utilities/Crawler/BasicCrawlerFunctions.py\n")
             file.write("\n")
             file.write("    Args:\n")
             file.write("        config: loaded configuration file of dataset\n")
-...
             file.write("    dataset_name = config[\"dataset-name\"]\n")
             file.write("    url = config['url']\n")
             file.write("    regex = config['regex']\n")
             file.write("    path_for_files = CRAWLED_DATA_PATH + dataset_name + '/'\n")
             file.write(
                 "    path_for_files = CRAWLED_DATA_PATH + dataset_name + '/'\n")
             file.write("    print(\"You must implements Crawl method first!\")\n")
-...
         create_default_processor(dataset_name)
         create_default_config_file(dataset_name)
     print("Zadejte jméno nového datasetu:\n")
     dataset_name = input().upper()

Také k dispozici: Unified diff

Projekt

Obecné

Profil

ASWI - Pokročilé softwarové inženýrství » ASWI 2020 » Aplikace nad otevřenými daty (KIV) – BHVS

Revize 2f227a6c

Přidáno uživatelem Tomáš Ballák před více než 3 roky(ů)

Projekt

Obecné

Profil

ASWI - Pokročilé softwarové inženýrství » ASWI 2020 » Aplikace nad otevřenými daty (KIV) – BHVS

Revize 2f227a6c

Přidáno uživatelem Tomáš Ballák před více než 3 roky(ů)

Související úkoly