fix bug of proxy while downloading doujinshi

0.4.15
fix bug
2025-07-01 16:09:28 +02:00 · 2021-06-02 23:20:56 +08:00 · 2021-05-08 15:36:49 +08:00 · 2021-05-08 15:36:36 +08:00 · 2021-04-25 09:56:49 +08:00 · 2021-04-24 16:39:54 -07:00
17 changed files with 275 additions and 235 deletions
--- a/.travis.yml
+++ b/.travis.yml
@ -4,13 +4,14 @@ os:
 language: python
 python:
    - 3.7
    - 3.8
 install:
    - python setup.py install
 script:
    - echo 268642 > /tmp/test.txt
-    - nhentai --cookie "_ga=GA1.2.2000087053.1558179358; __cfduid=d8930f7b43d04e1b2117719e28386b2e31593148489; csrftoken=3914GQGSmmqQyfQTBswNgfXuhFiefu8sAgOnsfZWiiqS4PJpKivuTp34p2USV6xu; sessionid=be0w2lwlprlmld3ahg9i592ipsuaw840"
+    - nhentai --cookie "_ga=GA1.2.1651446371.1545407218; __cfduid=d0ed34dfb81167d2a51a1d6392c1768a81601380350; csrftoken=KRN0GR1ft86m3HTefpQA99pp6R1Bo7hUs5QxNGOAIuwB5g4EcJj04fwMB8QKgLaB; sessionid=7hzoowox78c90wi5ud5ibphm4axcck7c"
    - nhentai --search umaru
    - nhentai --id=152503,146134 -t 10 --output=/tmp/ --cbz
    - nhentai -F
--- a/MANIFEST.in
+++ b/MANIFEST.in
@ -1,8 +1,4 @@
 include README.md
 include requirements.txt
-include nhentai/viewer/index.html
+include nhentai/viewer/*
-include nhentai/viewer/styles.css
+include nhentai/viewer/default/*
 include nhentai/viewer/scripts.js
 include nhentai/viewer/main.html
 include nhentai/viewer/main.css
 include nhentai/viewer/main.js
--- a/README.rst
+++ b/README.rst
@ -67,6 +67,15 @@ Set your nhentai cookie against captcha:
 **NOTE**: The format of the cookie is `"csrftoken=TOKEN; sessionid=ID"`
 | To get csrftoken and sessionid, first login to your nhentai account in web browser, then:
 | (Chrome) |ve| |ld| More tools    |ld| Developer tools     |ld| Application |ld| Storage |ld| Cookies |ld| https://nhentai.net
 | (Firefox) |hv| |ld| Web Developer |ld| Web Developer Tools                  |ld| Storage |ld| Cookies |ld| https://nhentai.net
 | 
 .. |hv| unicode:: U+2630 .. https://www.compart.com/en/unicode/U+2630
 .. |ve| unicode:: U+22EE .. https://www.compart.com/en/unicode/U+22EE
 .. |ld| unicode:: U+2014 .. https://www.compart.com/en/unicode/U+2014
 Download specified doujinshi:
 .. code-block:: bash
--- a/nhentai/init.py
+++ b/nhentai/init.py
@ -1,3 +1,3 @@
-__version__ = '0.4.1'
+__version__ = '0.4.15'
 __author__ = 'RicterZ'
 __email__ = 'ricterzheng@gmail.com'
--- a/nhentai/cmdline.py
+++ b/nhentai/cmdline.py
@ -1,8 +1,10 @@
 # coding: utf-8
-from __future__ import print_function
+
 import os
 import sys
 import json
 from optparse import OptionParser
 try:
    from itertools import ifilter as filter
 except ImportError:
@ -13,17 +15,6 @@ from nhentai import __version__
 from nhentai.utils import urlparse, generate_html, generate_main_html, DB
 from nhentai.logger import logger
 try:
    if sys.version_info < (3, 0, 0):
        import codecs
        import locale
        sys.stdout = codecs.getwriter(locale.getpreferredencoding())(sys.stdout)
        sys.stderr = codecs.getwriter(locale.getpreferredencoding())(sys.stderr)
 except NameError:
    # python3
    pass
 def banner():
    logger.info(u'''nHentai ver %s: あなたも変態。 いいね?
@ -35,7 +26,29 @@ def banner():
 ''' % __version__)
 def load_config():
    if not os.path.exists(constant.NHENTAI_CONFIG_FILE):
        return
    try:
        with open(constant.NHENTAI_CONFIG_FILE, 'r') as f:
            constant.CONFIG.update(json.load(f))
    except json.JSONDecodeError:
        logger.error('Failed to load config file.')
        write_config()
 def write_config():
    if not os.path.exists(constant.NHENTAI_HOME):
        os.mkdir(constant.NHENTAI_HOME)
    with open(constant.NHENTAI_CONFIG_FILE, 'w') as f:
        f.write(json.dumps(constant.CONFIG))
 def cmd_parser():
    load_config()
    parser = OptionParser('\n  nhentai --search [keyword] --download'
                          '\n  NHENTAI=http://h.loli.club nhentai --id [ID ...]'
                          '\n  nhentai --file [filename]'
@ -54,16 +67,16 @@ def cmd_parser():
                      help='list or download your favorites.')
    # page options
-    parser.add_option('--page', type='int', dest='page', action='store', default=1,
+    parser.add_option('--page-all', dest='page_all', action='store_true', default=False,
-                      help='page number of search results')
+                      help='all search results')
-    parser.add_option('--page-range', type='string', dest='page_range', action='store',
+    parser.add_option('--page', '--page-range', type='string', dest='page', action='store', default='',
-                      help='page range of favorites.  e.g. 1,2-5,14')
+                      help='page number of search results. e.g. 1,2-5,14')
    parser.add_option('--sorting', dest='sorting', action='store', default='recent',
                      help='sorting of doujinshi (recent / popular / popular-[today|week])',
                      choices=['recent', 'popular', 'popular-today', 'popular-week'])
    # download options
-    parser.add_option('--output', '-o', type='string', dest='output_dir', action='store', default='',
+    parser.add_option('--output', '-o', type='string', dest='output_dir', action='store', default='./',
                      help='output dir')
    parser.add_option('--threads', '-t', type='int', dest='threads', action='store', default=5,
                      help='thread count for downloading doujinshi')
@ -71,7 +84,7 @@ def cmd_parser():
                      help='timeout for downloading doujinshi')
    parser.add_option('--delay', '-d', type='int', dest='delay', action='store', default=0,
                      help='slow down between downloading every doujinshi')
-    parser.add_option('--proxy', '-p', type='string', dest='proxy', action='store', default='',
+    parser.add_option('--proxy', type='string', dest='proxy', action='store',
                      help='store a proxy, for example: -p \'http://127.0.0.1:1080\'')
    parser.add_option('--file',  '-f', type='string', dest='file', action='store', help='read gallery IDs from file.')
    parser.add_option('--format', type='string', dest='name_format', action='store',
@ -96,14 +109,17 @@ def cmd_parser():
                      help='set cookie of nhentai to bypass Google recaptcha')
    parser.add_option('--language', type='str', dest='language', action='store',
                      help='set default language to parse doujinshis')
    parser.add_option('--clean-language', dest='clean_language', action='store_true', default=False,
                      help='set DEFAULT as language to parse doujinshis')
    parser.add_option('--save-download-history', dest='is_save_download_history', action='store_true',
                      default=False, help='save downloaded doujinshis, whose will be skipped if you re-download them')
    parser.add_option('--clean-download-history', action='store_true', default=False, dest='clean_download_history',
                      help='clean download history')
    parser.add_option('--template', dest='viewer_template', action='store',
                      help='set viewer template', default='')
    try:
        sys.argv = [unicode(i.decode(sys.stdin.encoding)) for i in sys.argv]
        print()
    except (NameError, TypeError):
        pass
    except UnicodeDecodeError:
@ -126,69 +142,50 @@ def cmd_parser():
        logger.info('Download history cleaned.')
        exit(0)
-    if os.path.exists(constant.NHENTAI_COOKIE):
+    # --- set config ---
-        with open(constant.NHENTAI_COOKIE, 'r') as f:
+    if args.cookie is not None:
-            constant.COOKIE = f.read()
+        constant.CONFIG['cookie'] = args.cookie
    if args.cookie:
        try:
            if not os.path.exists(constant.NHENTAI_HOME):
                os.mkdir(constant.NHENTAI_HOME)
            with open(constant.NHENTAI_COOKIE, 'w') as f:
                f.write(args.cookie)
        except Exception as e:
            logger.error('Cannot create NHENTAI_HOME: {}'.format(str(e)))
            exit(1)
        logger.info('Cookie saved.')
        write_config()
        exit(0)
-    if os.path.exists(constant.NHENTAI_LANGUAGE) and not args.language:
+    if args.language is not None:
-        with open(constant.NHENTAI_LANGUAGE, 'r') as f:
+        constant.CONFIG['language'] = args.language
-            constant.LANGUAGE = f.read()
+        logger.info('Default language now set to \'{0}\''.format(args.language))
-            args.language = f.read()
+        write_config()
    if args.language:
        try:
            if not os.path.exists(constant.NHENTAI_HOME):
                os.mkdir(constant.NHENTAI_HOME)
            with open(constant.NHENTAI_LANGUAGE, 'w') as f:
                f.write(args.language)
        except Exception as e:
            logger.error('Cannot create NHENTAI_HOME: {}'.format(str(e)))
            exit(1)
        logger.info('Default language now is {}.'.format(args.language))
        exit(0)
        # TODO: search without language
-    if os.path.exists(constant.NHENTAI_PROXY):
+    if args.proxy is not None:
        with open(constant.NHENTAI_PROXY, 'r') as f:
            link = f.read()
            constant.PROXY = {'http': link, 'https': link}
    if args.proxy:
        try:
            if not os.path.exists(constant.NHENTAI_HOME):
                os.mkdir(constant.NHENTAI_HOME)
        proxy_url = urlparse(args.proxy)
-            if proxy_url.scheme not in ('http', 'https'):
+        if not args.proxy == '' and proxy_url.scheme not in ('http', 'https'):
            logger.error('Invalid protocol \'{0}\' of proxy, ignored'.format(proxy_url.scheme))
            else:
                with open(constant.NHENTAI_PROXY, 'w') as f:
                    f.write(args.proxy)
        except Exception as e:
            logger.error('Cannot create NHENTAI_HOME: {}'.format(str(e)))
            exit(1)
        logger.info('Proxy \'{0}\' saved.'.format(args.proxy))
            exit(0)
        else:
            constant.CONFIG['proxy'] = {
                'http': args.proxy,
                'https': args.proxy,
            }
            logger.info('Proxy now set to \'{0}\'.'.format(args.proxy))
            write_config()
            exit(0)
    if args.viewer_template is not None:
        if not args.viewer_template:
            args.viewer_template = 'default'
        if not os.path.exists(os.path.join(os.path.dirname(__file__),
                                           'viewer/{}/index.html'.format(args.viewer_template))):
            logger.error('Template \'{}\' does not exists'.format(args.viewer_template))
            exit(1)
        else:
            constant.CONFIG['template'] = args.viewer_template
            write_config()
    # --- end set config ---
    if args.favorites:
-        if not constant.COOKIE:
+        if not constant.CONFIG['cookie']:
            logger.warning('Cookie has not been set, please use `nhentai --cookie \'COOKIE\'` to set it.')
            exit(1)
--- a/nhentai/command.py
+++ b/nhentai/command.py
@ -1,28 +1,40 @@
 #!/usr/bin/env python2.7
 # coding: utf-8
-from __future__ import unicode_literals, print_function
+
 import sys
 import signal
 import platform
 import time
 from nhentai import constant
 from nhentai.cmdline import cmd_parser, banner
 from nhentai.parser import doujinshi_parser, search_parser, print_doujinshi, favorites_parser
 from nhentai.doujinshi import Doujinshi
 from nhentai.downloader import Downloader
 from nhentai.logger import logger
 from nhentai.constant import BASE_URL
-from nhentai.utils import generate_html, generate_cbz, generate_main_html, generate_pdf, check_cookie, signal_handler, DB
+from nhentai.utils import generate_html, generate_cbz, generate_main_html, generate_pdf, \
    paging, check_cookie, signal_handler, DB
 def main():
    banner()
    if sys.version_info < (3, 0, 0):
        logger.error('nhentai now only support Python 3.x')
        exit(1)
    options = cmd_parser()
    logger.info('Using mirror: {0}'.format(BASE_URL))
-    from nhentai.constant import PROXY
+    # CONFIG['proxy'] will be changed after cmd_parser()
-    # constant.PROXY will be changed after cmd_parser()
+    if constant.CONFIG['proxy']['http']:
-    if PROXY:
+        logger.info('Using proxy: {0}'.format(constant.CONFIG['proxy']['http']))
-        logger.info('Using proxy: {0}'.format(PROXY))
+
    if not constant.CONFIG['template']:
        constant.CONFIG['template'] = 'default'
    logger.info('Using viewer template "{}"'.format(constant.CONFIG['template']))
    # check your cookie
    check_cookie()
@ -31,18 +43,20 @@ def main():
    doujinshi_ids = []
    doujinshi_list = []
    page_list = paging(options.page)
    if options.favorites:
        if not options.is_download:
            logger.warning('You do not specify --download option')
-        doujinshis = favorites_parser(options.page_range)
+        doujinshis = favorites_parser(page=page_list)
    elif options.keyword:
-        from nhentai.constant import LANGUAGE
+        if constant.CONFIG['language']:
-        if LANGUAGE:
+            logger.info('Using default language: {0}'.format(constant.CONFIG['language']))
-            logger.info('Using deafult language: {0}'.format(LANGUAGE))
+            options.keyword += ' language:{}'.format(constant.CONFIG['language'])
-            options.keyword += ', language:{}'.format(LANGUAGE)
+        doujinshis = search_parser(options.keyword, sorting=options.sorting, page=page_list,
-        doujinshis = search_parser(options.keyword, sorting=options.sorting, page=options.page)
+                                   is_page_all=options.page_all)
    elif not doujinshi_ids:
        doujinshi_ids = options.id
@ -53,9 +67,9 @@ def main():
    if options.is_save_download_history:
        with DB() as db:
-                data = set(db.get_all())
+            data = map(int, db.get_all())
-            doujinshi_ids = list(set(doujinshi_ids) - data)
+        doujinshi_ids = list(set(map(int, doujinshi_ids)) - set(data))
    if doujinshi_ids:
        for i, id_ in enumerate(doujinshi_ids):
@ -83,7 +97,7 @@ def main():
                    db.add_one(doujinshi.id)
            if not options.is_nohtml and not options.is_cbz and not options.is_pdf:
-                generate_html(options.output_dir, doujinshi)
+                generate_html(options.output_dir, doujinshi, template=constant.CONFIG['template'])
            elif options.is_cbz:
                generate_cbz(options.output_dir, doujinshi, options.rm_origin_dir)
            elif options.is_pdf:
@ -103,5 +117,6 @@ def main():
 signal.signal(signal.SIGINT, signal_handler)
 if __name__ == '__main__':
    main()
--- a/nhentai/constant.py
+++ b/nhentai/constant.py
@ -1,5 +1,5 @@
 # coding: utf-8
-from __future__ import unicode_literals, print_function
+
 import os
 import tempfile
@ -26,12 +26,19 @@ u = urlparse(BASE_URL)
 IMAGE_URL = '%s://i.%s/galleries' % (u.scheme, u.hostname)
 NHENTAI_HOME = os.path.join(os.getenv('HOME', tempfile.gettempdir()), '.nhentai')
 NHENTAI_PROXY = os.path.join(NHENTAI_HOME, 'proxy')
 NHENTAI_COOKIE = os.path.join(NHENTAI_HOME, 'cookie')
 NHENTAI_LANGUAGE = os.path.join(NHENTAI_HOME, 'language')
 NHENTAI_HISTORY = os.path.join(NHENTAI_HOME, 'history.sqlite3')
 NHENTAI_CONFIG_FILE = os.path.join(NHENTAI_HOME, 'config.json')
-PROXY = {}
+CONFIG = {
    'proxy': {'http': '', 'https': ''},
    'cookie': '',
    'language': '',
    'template': '',
 }
-COOKIE = ''
+LANGUAGEISO ={
-LANGUAGE = ''
+    'english' : 'en',
    'chinese' : 'zh',
    'japanese' : 'ja',
    'translated' : 'translated'
 }
--- a/nhentai/doujinshi.py
+++ b/nhentai/doujinshi.py
@ -1,7 +1,6 @@
 # coding: utf-8
-from __future__ import print_function, unicode_literals
+
 from tabulate import tabulate
 from future.builtins import range
 from nhentai.constant import DETAIL_URL, IMAGE_URL
 from nhentai.logger import logger
@ -48,6 +47,7 @@ class Doujinshi(object):
    def show(self):
        table = [
            ["Parodies", self.info.parodies],
            ["Doujinshi", self.name],
            ["Subtitle", self.info.subtitle],
            ["Characters", self.info.characters],
--- a/nhentai/downloader.py
+++ b/nhentai/downloader.py
@ -1,5 +1,4 @@
 # coding: utf-
 from __future__ import unicode_literals, print_function
 import multiprocessing
 import signal
@ -15,6 +14,7 @@ try:
 except ImportError:
    from urlparse import urlparse
 from nhentai import constant
 from nhentai.logger import logger
 from nhentai.parser import request
 from nhentai.utils import Singleton
@ -35,7 +35,7 @@ class Downloader(Singleton):
        self.timeout = timeout
        self.delay = delay
-    def download_(self, url, folder='', filename='', retried=0):
+    def download_(self, url, folder='', filename='', retried=0, proxy=None):
        if self.delay:
            time.sleep(self.delay)
        logger.info('Starting to download {0} ...'.format(url))
@ -52,7 +52,7 @@ class Downloader(Singleton):
                i = 0
                while i < 10:
                    try:
-                        response = request('get', url, stream=True, timeout=self.timeout)
+                        response = request('get', url, stream=True, timeout=self.timeout, proxies=proxy)
                        if response.status_code != 200:
                            raise NHentaiImageNotExistException
@ -78,7 +78,8 @@ class Downloader(Singleton):
        except (requests.HTTPError, requests.Timeout) as e:
            if retried < 3:
                logger.warning('Warning: {0}, retrying({1}) ...'.format(str(e), retried))
-                return 0, self.download_(url=url, folder=folder, filename=filename, retried=retried+1)
+                return 0, self.download_(url=url, folder=folder, filename=filename,
                                         retried=retried+1, proxy=proxy)
            else:
                return 0, None
@ -120,16 +121,16 @@ class Downloader(Singleton):
            folder = os.path.join(self.path, folder)
        if not os.path.exists(folder):
-            logger.warn('Path \'{0}\' does not exist, creating.'.format(folder))
+            logger.warning('Path \'{0}\' does not exist, creating.'.format(folder))
            try:
                os.makedirs(folder)
            except EnvironmentError as e:
                logger.critical('{0}'.format(str(e)))
        else:
-            logger.warn('Path \'{0}\' already exist.'.format(folder))
+            logger.warning('Path \'{0}\' already exist.'.format(folder))
-        queue = [(self, url, folder) for url in queue]
+        queue = [(self, url, folder, constant.CONFIG['proxy']) for url in queue]
        pool = multiprocessing.Pool(self.size, init_worker)
        [pool.apply_async(download_wrapper, args=item) for item in queue]
@ -138,9 +139,9 @@ class Downloader(Singleton):
        pool.join()
-def download_wrapper(obj, url, folder=''):
+def download_wrapper(obj, url, folder='', proxy=None):
    if sys.platform == 'darwin' or semaphore.get_value():
-        return Downloader.download_(obj, url=url, folder=folder)
+        return Downloader.download_(obj, url=url, folder=folder, proxy=proxy)
    else:
        return -3, None
--- a/nhentai/logger.py
+++ b/nhentai/logger.py
@ -1,7 +1,6 @@
 #
 # Copyright (C) 2010-2012 Vinay Sajip. All rights reserved. Licensed under the new BSD license.
 #
 from __future__ import print_function, unicode_literals
 import logging
 import re
 import platform
@ -174,7 +173,7 @@ logger.setLevel(logging.DEBUG)
 if __name__ == '__main__':
    logger.log(15, 'nhentai')
    logger.info('info')
-    logger.warn('warn')
+    logger.warning('warning')
    logger.debug('debug')
    logger.error('error')
    logger.critical('critical')
--- a/nhentai/parser.py
+++ b/nhentai/parser.py
@ -1,7 +1,5 @@
 # coding: utf-8
 from __future__ import unicode_literals, print_function
 import sys
 import os
 import re
 import time
@ -64,7 +62,7 @@ def _get_title_and_id(response):
    return result
-def favorites_parser(page_range=''):
+def favorites_parser(page=None):
    result = []
    html = BeautifulSoup(request('get', constant.FAV_URL).content, 'html.parser')
    count = html.find('span', attrs={'class': 'count'})
@ -78,6 +76,9 @@ def favorites_parser(page_range=''):
        return []
    pages = int(count / 25)
    if page:
        page_range_list = page
    else:
        if pages:
            pages += 1 if count % (25 * pages) else 0
        else:
@ -89,9 +90,6 @@ def favorites_parser(page_range=''):
            pages = 1
        page_range_list = range(1, pages + 1)
    if page_range:
        logger.info('page range is {0}'.format(page_range))
        page_range_list = page_range_parser(page_range, pages)
    for page in page_range_list:
        try:
@ -105,32 +103,6 @@ def favorites_parser(page_range=''):
    return result
 def page_range_parser(page_range, max_page_num):
    pages = set()
    ranges = str.split(page_range, ',')
    for range_str in ranges:
        idx = range_str.find('-')
        if idx == -1:
            try:
                page = int(range_str)
                if page <= max_page_num:
                    pages.add(page)
            except ValueError:
                logger.error('page range({0}) is not valid'.format(page_range))
        else:
            try:
                left = int(range_str[:idx])
                right = int(range_str[idx + 1:])
                if right > max_page_num:
                    right = max_page_num
                for page in range(left, right + 1):
                    pages.add(page)
            except ValueError:
                logger.error('page range({0}) is not valid'.format(page_range))
    return list(pages)
 def doujinshi_parser(id_):
    if not isinstance(id_, (int,)) and (isinstance(id_, (str,)) and not id_.isdigit()):
        raise Exception('Doujinshi id({0}) is not valid'.format(id_))
@ -145,13 +117,16 @@ def doujinshi_parser(id_):
        response = request('get', url)
        if response.status_code in (200, ):
            response = response.content
        elif response.status_code in (404,):
            logger.error("Doujinshi with id {0} cannot be found".format(id_))
            return []
        else:
            logger.debug('Slow down and retry ({}) ...'.format(id_))
            time.sleep(1)
            return doujinshi_parser(str(id_))
    except Exception as e:
-        logger.warn('Error: {}, ignored'.format(str(e)))
+        logger.warning('Error: {}, ignored'.format(str(e)))
        return None
    html = BeautifulSoup(response, 'html.parser')
@ -205,7 +180,7 @@ def old_search_parser(keyword, sorting='date', page=1):
    result = _get_title_and_id(response)
    if not result:
-        logger.warn('Not found anything of keyword {}'.format(keyword))
+        logger.warning('Not found anything of keyword {}'.format(keyword))
    return result
@ -215,30 +190,39 @@ def print_doujinshi(doujinshi_list):
        return
    doujinshi_list = [(i['id'], i['title']) for i in doujinshi_list]
    headers = ['id', 'doujinshi']
-    logger.info('Search Result\n' +
+    logger.info('Search Result || Found %i doujinshis \n' % doujinshi_list.__len__() +
                tabulate(tabular_data=doujinshi_list, headers=headers, tablefmt='rst'))
-def search_parser(keyword, sorting, page):
+def search_parser(keyword, sorting, page, is_page_all=False):
-    logger.debug('Searching doujinshis using keywords {0}'.format(keyword))
+    # keyword = '+'.join([i.strip().replace(' ', '-').lower() for i in keyword.split(',')])
    keyword = '+'.join([i.strip().replace(' ', '-').lower() for i in keyword.split(',')])
    result = []
    if not page:
        page = [1]
    if is_page_all:
        url = request('get', url=constant.SEARCH_URL, params={'query': keyword}).url
        init_response = request('get', url.replace('%2B', '+')).json()
        page = range(1, init_response['num_pages']+1)
    total = '/{0}'.format(page[-1]) if is_page_all else ''
    for p in page:
        i = 0
-    while i < 5:
+
        logger.info('Searching doujinshis using keywords "{0}" on page {1}{2}'.format(keyword, p, total))
        while i < 3:
            try:
-            url = request('get', url=constant.SEARCH_URL, params={'query': keyword, 'page': page, 'sort': sorting}).url
+                url = request('get', url=constant.SEARCH_URL, params={'query': keyword,
                                                                      'page': p, 'sort': sorting}).url
                response = request('get', url.replace('%2B', '+')).json()
            except Exception as e:
            i += 1
            if not i < 5:
                logger.critical(str(e))
-                logger.warn('If you are in China, please configure the proxy to fu*k GFW.')
+
                exit(1)
            continue
            break
        if 'result' not in response:
-        raise Exception('No result in response')
+            logger.warning('No result in response in page {}'.format(p))
            break
        for row in response['result']:
            title = row['title']['english']
@ -246,7 +230,7 @@ def search_parser(keyword, sorting, page):
            result.append({'id': row['id'], 'title': title})
        if not result:
-        logger.warn('No results for keywords {}'.format(keyword))
+            logger.warning('No results for keywords {}'.format(keyword))
    return result
--- a/nhentai/serializer.py
+++ b/nhentai/serializer.py
@ -2,7 +2,7 @@
 import json
 import os
 from xml.sax.saxutils import escape
-
+from nhentai.constant import LANGUAGEISO
 def serialize_json(doujinshi, dir):
    metadata = {'title': doujinshi.name,
@ -65,7 +65,8 @@ def serialize_comicxml(doujinshi, dir):
        if doujinshi.info.languages:
            languages = [i.strip() for i in doujinshi.info.languages.split(',')]
            xml_write_simple_tag(f, 'Translated', 'Yes' if 'translated' in languages else 'No')
-            [xml_write_simple_tag(f, 'Language', i) for i in languages if i != 'translated']
+            [xml_write_simple_tag(f, 'LanguageISO', LANGUAGEISO[i]) for i in languages \
                if (i != 'translated' and i in LANGUAGEISO)]
        f.write('</ComicInfo>')
--- a/nhentai/utils.py
+++ b/nhentai/utils.py
@ -1,10 +1,8 @@
 # coding: utf-8
 from __future__ import unicode_literals, print_function
 import sys
 import re
 import os
 import string
 import zipfile
 import shutil
 import requests
@ -20,9 +18,13 @@ def request(method, url, **kwargs):
    session.headers.update({
        'Referer': constant.LOGIN_URL,
        'User-Agent': 'nhentai command line client (https://github.com/RicterZ/nhentai)',
-        'Cookie': constant.COOKIE
+        'Cookie': constant.CONFIG['cookie']
    })
-    return getattr(session, method)(url, proxies=constant.PROXY, verify=False, **kwargs)
+
    if not kwargs.get('proxies', None):
        kwargs['proxies'] = constant.CONFIG['proxy']
    return getattr(session, method)(url, verify=False, **kwargs)
 def check_cookie():
@ -64,7 +66,7 @@ def readfile(path):
        return file.read()
-def generate_html(output_dir='.', doujinshi_obj=None):
+def generate_html(output_dir='.', doujinshi_obj=None, template='default'):
    image_html = ''
    if doujinshi_obj is not None:
@ -81,9 +83,9 @@ def generate_html(output_dir='.', doujinshi_obj=None):
        image_html += '<img src="{0}" class="image-item"/>\n'\
            .format(image)
-    html = readfile('viewer/index.html')
+    html = readfile('viewer/{}/index.html'.format(template))
-    css = readfile('viewer/styles.css')
+    css = readfile('viewer/{}/styles.css'.format(template))
-    js = readfile('viewer/scripts.js')
+    js = readfile('viewer/{}/scripts.js'.format(template))
    if doujinshi_obj is not None:
        serialize_json(doujinshi_obj, doujinshi_dir)
@ -168,7 +170,7 @@ def generate_main_html(output_dir='./'):
        logger.warning('Writing Main Viewer failed ({})'.format(str(e)))
-def generate_cbz(output_dir='.', doujinshi_obj=None, rm_origin_dir=False, write_comic_info=False):
+def generate_cbz(output_dir='.', doujinshi_obj=None, rm_origin_dir=False, write_comic_info=True):
    if doujinshi_obj is not None:
        doujinshi_dir = os.path.join(output_dir, doujinshi_obj.filename)
        if write_comic_info:
@ -196,8 +198,6 @@ def generate_cbz(output_dir='.', doujinshi_obj=None, rm_origin_dir=False, write_
 def generate_pdf(output_dir='.', doujinshi_obj=None, rm_origin_dir=False):
    try:
        import img2pdf
    except ImportError:
        logger.error("Please install img2pdf package by using pip.")
        """Write images to a PDF file using img2pdf."""
        if doujinshi_obj is not None:
@ -225,23 +225,34 @@ def generate_pdf(output_dir='.', doujinshi_obj=None, rm_origin_dir=False):
        logger.log(15, 'PDF file has been written to \'{0}\''.format(doujinshi_dir))
    except ImportError:
        logger.error("Please install img2pdf package by using pip.")
 def unicode_truncate(s, length, encoding='utf-8'):
    """https://stackoverflow.com/questions/1809531/truncating-unicode-so-it-fits-a-maximum-size-when-encoded-for-wire-transfer
    """
    encoded = s.encode(encoding)[:length]
    return encoded.decode(encoding, 'ignore')
 def format_filename(s):
-    """Take a string and return a valid filename constructed from the string.
+    """
-Uses a whitelist approach: any characters not present in valid_chars are
+    It used to be a whitelist approach allowed only alphabet and a part of symbols.
-removed. Also spaces are replaced with underscores.
+    but most doujinshi's names include Japanese 2-byte characters and these was rejected.
-
+    so it is using blacklist approach now.
-Note: this method may produce invalid filenames such as ``, `.` or `..`
+    if filename include forbidden characters (\'/:,;*?"<>|) ,it replace space character(' '). 
 When I use this method I prepend a date string like '2009_01_15_19_46_32_'
 and append a file extension like '.txt', so I avoid the potential of using
 an invalid filename.
    """
    # maybe you can use `--format` to select a suitable filename
-    valid_chars = "-_.()[] %s%s" % (string.ascii_letters, string.digits)
+    ban_chars = '\\\'/:,;*?"<>|\t'
-    filename = ''.join(c for c in s if c in valid_chars)
+    filename = s.translate(str.maketrans(ban_chars, ' '*len(ban_chars))).strip()
    filename = ' '.join(filename.split())
    print(repr(filename))
    while filename.endswith('.'):
        filename = filename[:-1]
    if len(filename) > 100:
-        filename = filename[:100] + '...]'
+        filename = filename[:100] + u'…'
    # Remove [] from filename
    filename = filename.replace('[]', '').strip()
@ -253,6 +264,26 @@ def signal_handler(signal, frame):
    exit(1)
 def paging(page_string):
    # 1,3-5,14 -> [1, 3, 4, 5, 14]
    if not page_string:
        return []
    page_list = []
    for i in page_string.split(','):
        if '-' in i:
            start, end = i.split('-')
            if not (start.isdigit() and end.isdigit()):
                raise Exception('Invalid page number')
            page_list.extend(list(range(int(start), int(end)+1)))
        else:
            if not i.isdigit():
                raise Exception('Invalid page number')
            page_list.append(int(i))
    return page_list
 class DB(object):
    conn = None
    cur = None
--- a/nhentai/viewer/default/index.html
+++ b/nhentai/viewer/default/index.html
--- a/nhentai/viewer/default/scripts.js
+++ b/nhentai/viewer/default/scripts.js
--- a/nhentai/viewer/default/styles.css
+++ b/nhentai/viewer/default/styles.css
--- a/requirements.txt
+++ b/requirements.txt
@ -1,7 +1,6 @@
 requests>=2.5.0
-soupsieve<2.0
+soupsieve
 BeautifulSoup4>=4.0.0
 threadpool>=1.2.7
 tabulate>=0.7.5
 future>=0.15.2
 iso8601 >= 0.1
Author	SHA1	Message	Date
RicterZ	d9d2a6fb91	fix bug of proxy while downloading doujinshi	2021-06-02 23:20:56 +08:00
RicterZ	8cd4b948e7	0.4.15	2021-05-08 15:36:49 +08:00
RicterZ	f884384eb3	fix bug	2021-05-08 15:36:36 +08:00
Ricter Zheng	87afab46c4	Merge pull request #211 from jwfiredragon/master	2021-04-25 09:56:49 +08:00
Johnny Wei	c7b1d7e6a8	Fix broken constant import	2021-04-24 16:39:54 -07:00
Ricter Zheng	ad02371158	Update constant.py	2021-04-21 15:37:13 +08:00
Ricter Zheng	7c9d55e0ee	Merge pull request #208 from karamori77/master Changed write_comic_info from False to True	2021-04-21 15:30:51 +08:00
karamori77	00aad774ae	Fixed potential re-download Moved forward save-history check 1 indent so it works with download by id too Mapped all ids to int since there are cases where its a string in the API	2021-04-20 11:04:52 +08:00
karamori77	373086b459	Update serializer.py changed Language to LanguageISO for ComicInfo.xml Language will be displayed by the LanguageISO code, it also forgoes rare language tags like rewrite and speechless	2021-04-18 21:45:15 +08:00
karamori77	3a83f99771	Update constant.py	2021-04-18 21:40:47 +08:00
karamori77	00627ab36a	Update utils.py	2021-04-03 23:11:33 +08:00
Ricter Zheng	592e163891	Update requirements.txt	2021-03-26 22:25:49 +08:00
Ricter Zheng	84523475b0	Merge pull request #206 from Un1Gfn/patch-1	2021-03-25 19:01:39 +08:00
Darren Ng	5f5461c902	Instuctions on getting csrftoken & sessionid	2021-03-25 18:57:20 +08:00
Ricter Zheng	05e6ceb3cd	Merge pull request #205 from Nontre12/master	2021-03-25 09:22:13 +08:00
Nontre	db59426503	FIX: Use of img2lib even if it is not installed	2021-03-24 21:49:45 +01:00
Ricter Z	74197f8f90	0.4.14 released for fix issue #204	2021-02-11 15:42:53 +08:00
Ricter Zheng	6d91a39533	Merge pull request #203 from jwfiredragon/master Switching 'logger.warn' to 'logger.warning'	2021-02-11 15:41:15 +08:00
Johnny Wei	e181e0b9dd	Switching 'logger.warn' to 'logger.warning'	2021-02-10 22:45:22 -08:00
Ricter Z	6fed1f94cb	0.4.13	2021-01-18 16:26:39 +08:00
Ricter Zheng	9cfb23c8ec	Merge pull request #201 from mobrine1/patch-1 Fix #200	2021-01-18 16:25:42 +08:00
mobrine1	fc347cdadf	Fix #200	2021-01-17 15:02:43 -05:00
Ricter Zheng	1cdebaab61	Merge pull request #199 from RicterZ/dev 0.4.12	2021-01-17 12:16:56 +08:00
Ricter Z	9513141ccf	0.4.12	2021-01-17 11:51:22 +08:00
Ricter Z	bdc9fa113e	fix #197 set proxy to null	2021-01-17 11:50:22 +08:00
Ricter Z	36946111db	fix #198 add notice	2021-01-17 11:42:06 +08:00
Ricter Zheng	ce8ae54536	Merge pull request #195 from RicterZ/dev 0.4.11	2021-01-11 11:19:58 +08:00
Ricter Zheng	7aedb905d6	Merge pull request #194 from RicterZ/dev 0.4.11	2021-01-11 11:16:09 +08:00
RicterZ	8b8b5f193e	0.4.11	2021-01-11 11:15:21 +08:00
RicterZ	fc99d91ac1	fix #193	2021-01-11 11:14:35 +08:00
RicterZ	ba141efba7	remove repeated spaces	2021-01-11 11:04:29 +08:00
RicterZ	f78d8750f3	remove __future__	2021-01-11 11:03:45 +08:00
Ricter Zheng	08bb8ffda4	Merge pull request #192 from RicterZ/dev Dev	2021-01-10 14:41:02 +08:00
Ricter Zheng	af379c825c	Merge branch 'master' into dev	2021-01-10 14:40:09 +08:00
RicterZ	2f9386f22c	fix #188	2021-01-10 11:44:04 +08:00
RicterZ	3667bc34b7	0.4.10	2021-01-10 11:41:38 +08:00
RicterZ	84749c56bd	fix #191	2021-01-10 11:40:46 +08:00
Ricter Zheng	24f79e0945	Merge pull request #190 from RicterZ/dev fix bugs	2021-01-07 20:42:26 +08:00
Ricter Zheng	edc46a9531	Merge pull request #189 from mobrine1/mobrine1-patch-1 Fixing loop when id not found, issue #188	2021-01-07 20:39:44 +08:00
mobrine1	72035a14e6	Fixing loop when id not found, issue #188	2021-01-07 07:32:29 -05:00
Ricter Zheng	472528e464	Merge pull request #187 from atsushi-hirako/patch-1 fix issue #186	2021-01-02 02:16:50 +08:00
atsushi-hirako	3f5915fd2a	fix issue #186 change to blacklist approach (allow 2-bytes character)	2021-01-01 20:11:09 +09:00
Ricter Z	0cd2576dab	0.4.9	2020-12-02 07:45:31 +08:00
Ricter Zheng	445a8c052e	Merge pull request #180 from RicterZ/dev 0.4.8	2020-12-01 21:01:00 +08:00
Ricter Z	7a75afef0a	0.4.8	2020-12-01 20:58:28 +08:00
Ricter Z	a5813e19b1	fix bug on first start	2020-12-01 20:56:27 +08:00
RicterZ	8462d2f2aa	use dict.update to update config values	2020-11-26 17:52:10 +08:00
RicterZ	51074ee948	support multi viewers	2020-11-26 17:22:23 +08:00
RicterZ	9c7354be32	0.4.6	2020-11-07 12:04:42 +08:00
Ricter Zheng	7f48b3edd1	Merge pull request #175 from RicterZ/dev add default value of output dir	2020-10-15 02:10:06 +08:00
RicterZ	d84b827241	add default value of output dir	2020-10-15 02:09:09 +08:00
Ricter Zheng	4ac161a38c	Merge pull request #174 from Nontre12/fix-gen-main Fix change directory output_dir option on gen-main	2020-10-15 01:47:51 +08:00
Nontre12	648b6f87bf	Added logo.png to the installation	2020-10-14 12:09:39 +02:00
Nontre12	2ec1283ba8	Fix change directory output_dir option on gen-main	2020-10-14 12:02:57 +02:00
Ricter Zheng	a9bd46b426	Merge pull request #173 from Nontre12/db-ignored Fix db ignored	2020-10-14 02:44:03 +08:00
Nontre12	c52bc271fc	Fix db ignored	2020-10-13 13:39:24 +02:00
Ricter Zheng	f2d22f8e7d	Merge pull request #169 from Nontre12/master Fix running without parameters	2020-10-11 03:48:39 +08:00
Nontre12	ea6089ff31	Fix	2020-10-10 21:15:20 +02:00
Nontre	670d14c3f3	Merge pull request #4 from RicterZ/master Update master branch	2020-10-10 20:50:01 +02:00
Ricter Zheng	b46106a5bc	Merge pull request #167 from RicterZ/0.4.5 0.4.5	2020-10-11 02:00:02 +08:00
RicterZ	f04359e486	0.4.5	2020-10-11 01:57:37 +08:00
Ricter Zheng	6861cbcbc1	Merge pull request #166 from RicterZ/dev 0.4.4	2020-10-11 01:45:53 +08:00
Ricter Zheng	e0938c5a0e	Merge pull request #165 from RicterZ/dev 0.4.4	2020-10-11 01:43:41 +08:00
RicterZ	641f8e4c51	0.4.4	2020-10-11 01:42:02 +08:00
RicterZ	b2fae226f9	use config.json	2020-10-11 01:38:08 +08:00
Nontre	4aa34c668a	Merge pull request #3 from RicterZ/master Update master branch from origin	2020-10-10 19:11:56 +02:00
RicterZ	f157ac3246	merge to functions	2020-10-11 01:09:13 +08:00
Ricter Zheng	139e01d3ca	Merge pull request #163 from Nontre12/dev-page-range Added --page-all option to download all search results	2020-10-11 00:58:57 +08:00
Ricter Zheng	4d870e36a1	Merge branch 'master' into dev-page-range	2020-10-11 00:53:27 +08:00
Ricter Zheng	74b0df26a9	Merge pull request #164 from RicterZ/fix-page-range fix page range issue #158	2020-10-11 00:51:58 +08:00
RicterZ	1746e731ec	fix page range issue #158	2020-10-11 00:48:36 +08:00
Nontre	8ad60d9838	Merge pull request #1 from RicterZ/master Merge pull request #162 from Nontre12/master	2020-10-10 18:31:47 +02:00
Nontre12	be05b9c0eb	Added --page-all option to download all search results	2020-10-10 18:29:00 +02:00
Ricter Zheng	9054b98934	Merge pull request #162 from Nontre12/master Added 'Parodies' output and Updated package version	2020-10-11 00:10:27 +08:00
Nontre12	b82201ff27	Added to -S --show option the "Parodies" output	2020-10-10 12:33:14 +02:00
Nontre12	532c74e075	Update __version__	2020-10-10 12:31:54 +02:00
Ricter Zheng	5a50a5b1ba	Merge pull request #159 from Nontre12/dev Added --clean-language option	2020-10-10 04:56:51 +08:00
Nontre12	b5fe48746e	Added --clean-language option	2020-10-09 17:34:03 +02:00
Nontre12	94d8da655a	Fix misspelling	2020-10-09 17:30:11 +02:00
Ricter Zheng	6ff2816d95	Merge pull request #157 from RicterZ/dev 0.4.3	2020-10-02 01:59:50 +08:00
Ricter Z	4d89b80e67	Merge branch 'dev' of github.com:RicterZ/nhentai into dev	2020-10-02 01:56:31 +08:00
Ricter Zheng	0a94ef9cf1	Merge pull request #156 from RicterZ/dev 0.4.2	2020-10-02 01:56:04 +08:00
Ricter Z	4cc4f35a0d	fix bug in search	2020-10-02 01:55:03 +08:00
Ricter Zheng	ad86c49de9	Merge branch 'master' into dev	2020-10-02 01:47:35 +08:00
Ricter Z	5a538fe82f	add tests and new python version	2020-10-02 01:43:44 +08:00
Ricter Z	eb35ba9848	0.4.2	2020-10-02 01:41:02 +08:00
Ricter Zheng	b0902c2d58	Merge pull request #147 from fuchs2711/fix-win32-filename Fix invalid filenames on Windows	2020-07-19 11:12:25 +08:00
Fuzi Fuz	320f36c264	Fix invalid filenames on Windows	2020-07-18 15:19:41 +02:00
Ricter Zheng	1dae63be39	Merge pull request #141 from RicterZ/dev update tests	2020-06-26 13:32:35 +08:00
Ricter Zheng	8ed1b89277	Merge pull request #140 from RicterZ/dev 0.4.0	2020-06-26 13:16:55 +08:00