/python-module/Utilities/Crawler/BasicCrawlerFunctions.py - Diff - Aplikace nad otevřenými daty (KIV) – BHVS - Redmine

« Předchozí | Další »

Revize 1187e871

Re #7966
- Vytvoreny pomocne skripty pro spravu datasetu

     # Path to crawler logs
     CRAWLER_LOGS_PATH = "CrawlerLogs/"
     # Path to crawled data
     CRAWLED_DATA_PATH = "CrawledData/"
     def get_all_links(url):
-...
         url_parts = url.split("/")
         file_name = url_parts[len(url_parts)-1]
         path = CRAWLER_LOGS_PATH + dataset_name + '/'
         log_path = CRAWLER_LOGS_PATH + dataset_name + '/'
         data_path = CRAWLED_DATA_PATH + dataset_name + '/'
         # download file chunk by chunk so we can download large files
         with open(path + file_name, "wb") as file:
         with open(data_path + file_name, "wb") as file:
             for chunk in r.iter_content(chunk_size=1024):
                 # writing one chunk at a time to file

Také k dispozici: Unified diff