0.4.5

Merge pull request #166 from RicterZ/dev
0.4.4
2025-07-01 07:59:29 +02:00 · 2020-10-11 01:57:37 +08:00 · 2020-10-11 01:45:53 +08:00 · 2020-10-11 01:43:41 +08:00 · 2020-10-11 01:42:02 +08:00 · 2020-10-11 01:38:08 +08:00
10 changed files with 154 additions and 155 deletions
--- a/.travis.yml
+++ b/.travis.yml
@ -4,13 +4,14 @@ os:
 language: python
 python:
    - 3.7
+    - 3.8

 install:
    - python setup.py install

 script:
    - echo 268642 > /tmp/test.txt
-    - nhentai --cookie "_ga=GA1.2.2000087053.1558179358; __cfduid=d8930f7b43d04e1b2117719e28386b2e31593148489; csrftoken=3914GQGSmmqQyfQTBswNgfXuhFiefu8sAgOnsfZWiiqS4PJpKivuTp34p2USV6xu; sessionid=be0w2lwlprlmld3ahg9i592ipsuaw840"
+    - nhentai --cookie "_ga=GA1.2.1651446371.1545407218; __cfduid=d0ed34dfb81167d2a51a1d6392c1768a81601380350; csrftoken=KRN0GR1ft86m3HTefpQA99pp6R1Bo7hUs5QxNGOAIuwB5g4EcJj04fwMB8QKgLaB; sessionid=7hzoowox78c90wi5ud5ibphm4axcck7c"
    - nhentai --search umaru
    - nhentai --id=152503,146134 -t 10 --output=/tmp/ --cbz
    - nhentai -F
--- a/nhentai/init.py
+++ b/nhentai/init.py
@ -1,3 +1,3 @@
-__version__ = '0.4.0'
+__version__ = '0.4.5'
 __author__ = 'RicterZ'
 __email__ = 'ricterzheng@gmail.com'
--- a/nhentai/cmdline.py
+++ b/nhentai/cmdline.py
@ -2,7 +2,9 @@
 from __future__ import print_function
 import os
 import sys
+import json
 from optparse import OptionParser
+
 try:
    from itertools import ifilter as filter
 except ImportError:
@ -35,7 +37,29 @@ def banner():
 ''' % __version__)


+def load_config():
+    if not os.path.exists(constant.NHENTAI_CONFIG_FILE):
+        return
+
+    try:
+        with open(constant.NHENTAI_CONFIG_FILE, 'r') as f:
+            constant.CONFIG = json.load(f)
+    except json.JSONDecodeError:
+        logger.error('Failed to load config file.')
+        write_config()
+
+
+def write_config():
+    if not os.path.exists(constant.NHENTAI_HOME):
+        os.mkdir(constant.NHENTAI_HOME)
+
+    with open(constant.NHENTAI_CONFIG_FILE, 'w') as f:
+        f.write(json.dumps(constant.CONFIG))
+
+
 def cmd_parser():
+    load_config()
+
    parser = OptionParser('\n  nhentai --search [keyword] --download'
                          '\n  NHENTAI=http://h.loli.club nhentai --id [ID ...]'
                          '\n  nhentai --file [filename]'
@ -54,10 +78,10 @@ def cmd_parser():
                      help='list or download your favorites.')

    # page options
-    parser.add_option('--page', type='int', dest='page', action='store', default=1,
-                      help='page number of search results')
-    parser.add_option('--page-range', type='string', dest='page_range', action='store',
-                      help='page range of favorites.  e.g. 1,2-5,14')
+    parser.add_option('--page-all', dest='page_all', action='store_true', default=False,
+                      help='all search results')
+    parser.add_option('--page', '--page-range', type='string', dest='page', action='store', default='',
+                      help='page number of search results. e.g. 1,2-5,14')
    parser.add_option('--sorting', dest='sorting', action='store', default='recent',
                      help='sorting of doujinshi (recent / popular / popular-[today|week])',
                      choices=['recent', 'popular', 'popular-today', 'popular-week'])
@ -71,7 +95,7 @@ def cmd_parser():
                      help='timeout for downloading doujinshi')
    parser.add_option('--delay', '-d', type='int', dest='delay', action='store', default=0,
                      help='slow down between downloading every doujinshi')
-    parser.add_option('--proxy', '-p', type='string', dest='proxy', action='store', default='',
+    parser.add_option('--proxy', type='string', dest='proxy', action='store', default='',
                      help='store a proxy, for example: -p \'http://127.0.0.1:1080\'')
    parser.add_option('--file',  '-f', type='string', dest='file', action='store', help='read gallery IDs from file.')
    parser.add_option('--format', type='string', dest='name_format', action='store',
@ -96,6 +120,8 @@ def cmd_parser():
                      help='set cookie of nhentai to bypass Google recaptcha')
    parser.add_option('--language', type='str', dest='language', action='store',
                      help='set default language to parse doujinshis')
+    parser.add_option('--clean-language', dest='clean_language', action='store_true', default=False,
+                      help='set DEFAULT as language to parse doujinshis')
    parser.add_option('--save-download-history', dest='is_save_download_history', action='store_true',
                      default=False, help='save downloaded doujinshis, whose will be skipped if you re-download them')
    parser.add_option('--clean-download-history', action='store_true', default=False, dest='clean_download_history',
@ -126,69 +152,37 @@ def cmd_parser():
        logger.info('Download history cleaned.')
        exit(0)

-    if os.path.exists(constant.NHENTAI_COOKIE):
-        with open(constant.NHENTAI_COOKIE, 'r') as f:
-            constant.COOKIE = f.read()
-
-    if args.cookie:
-        try:
-            if not os.path.exists(constant.NHENTAI_HOME):
-                os.mkdir(constant.NHENTAI_HOME)
-
-            with open(constant.NHENTAI_COOKIE, 'w') as f:
-                f.write(args.cookie)
-        except Exception as e:
-            logger.error('Cannot create NHENTAI_HOME: {}'.format(str(e)))
-            exit(1)
-
+    # --- set config ---
+    if args.cookie is not None:
+        constant.CONFIG['cookie'] = args.cookie
        logger.info('Cookie saved.')
+        write_config()
        exit(0)

-    if os.path.exists(constant.NHENTAI_LANGUAGE) and not args.language:
-        with open(constant.NHENTAI_LANGUAGE, 'r') as f:
-            constant.LANGUAGE = f.read()
-            args.language = f.read()
-
-    if args.language:
-        try:
-            if not os.path.exists(constant.NHENTAI_HOME):
-                os.mkdir(constant.NHENTAI_HOME)
-
-            with open(constant.NHENTAI_LANGUAGE, 'w') as f:
-                f.write(args.language)
-        except Exception as e:
-            logger.error('Cannot create NHENTAI_HOME: {}'.format(str(e)))
-            exit(1)
-
-        logger.info('Default language now is {}.'.format(args.language))
+    if args.language is not None:
+        constant.CONFIG['language'] = args.language
+        logger.info('Default language now set to \'{0}\''.format(args.language))
+        write_config()
        exit(0)
+        # TODO: search without language

-    if os.path.exists(constant.NHENTAI_PROXY):
-        with open(constant.NHENTAI_PROXY, 'r') as f:
-            link = f.read()
-            constant.PROXY = {'http': link, 'https': link}
-
-    if args.proxy:
-        try:
-            if not os.path.exists(constant.NHENTAI_HOME):
-                os.mkdir(constant.NHENTAI_HOME)
-
+    if args.proxy is not None:
        proxy_url = urlparse(args.proxy)
-            if proxy_url.scheme not in ('http', 'https'):
+        if not args.proxy == '' and proxy_url.scheme not in ('http', 'https'):
            logger.error('Invalid protocol \'{0}\' of proxy, ignored'.format(proxy_url.scheme))
-            else:
-                with open(constant.NHENTAI_PROXY, 'w') as f:
-                    f.write(args.proxy)
-
-        except Exception as e:
-            logger.error('Cannot create NHENTAI_HOME: {}'.format(str(e)))
-            exit(1)
-
-        logger.info('Proxy \'{0}\' saved.'.format(args.proxy))
            exit(0)
+        else:
+            constant.CONFIG['proxy'] = {
+                'http': args.proxy,
+                'https': args.proxy,
+            }
+            logger.info('Proxy now set to \'{0}\'.'.format(args.proxy))
+            write_config()
+            exit(0)
+    # --- end set config ---

    if args.favorites:
-        if not constant.COOKIE:
+        if not constant.CONFIG['cookie']:
            logger.warning('Cookie has not been set, please use `nhentai --cookie \'COOKIE\'` to set it.')
            exit(1)

--- a/nhentai/command.py
+++ b/nhentai/command.py
@ -1,17 +1,21 @@
 #!/usr/bin/env python2.7
 # coding: utf-8
 from __future__ import unicode_literals, print_function
+import json
+import os
 import signal
 import platform
 import time

+from nhentai import constant
 from nhentai.cmdline import cmd_parser, banner
 from nhentai.parser import doujinshi_parser, search_parser, print_doujinshi, favorites_parser
 from nhentai.doujinshi import Doujinshi
 from nhentai.downloader import Downloader
 from nhentai.logger import logger
-from nhentai.constant import BASE_URL
-from nhentai.utils import generate_html, generate_cbz, generate_main_html, generate_pdf, check_cookie, signal_handler, DB
+from nhentai.constant import NHENTAI_CONFIG_FILE, BASE_URL
+from nhentai.utils import generate_html, generate_cbz, generate_main_html, generate_pdf, \
+    paging, check_cookie, signal_handler, DB


 def main():
@ -19,10 +23,9 @@ def main():
    options = cmd_parser()
    logger.info('Using mirror: {0}'.format(BASE_URL))

-    from nhentai.constant import PROXY
-    # constant.PROXY will be changed after cmd_parser()
-    if PROXY:
-        logger.info('Using proxy: {0}'.format(PROXY))
+    # CONFIG['proxy'] will be changed after cmd_parser()
+    if constant.CONFIG['proxy']:
+        logger.info('Using proxy: {0}'.format(constant.CONFIG['proxy']))

    # check your cookie
    check_cookie()
@ -31,18 +34,20 @@ def main():
    doujinshi_ids = []
    doujinshi_list = []

+    page_list = paging(options.page)
+
    if options.favorites:
        if not options.is_download:
            logger.warning('You do not specify --download option')

-        doujinshis = favorites_parser(options.page_range)
+        doujinshis = favorites_parser(page=page_list)

    elif options.keyword:
-        from nhentai.constant import LANGUAGE
-        if LANGUAGE:
-            logger.info('Using deafult language: {0}'.format(LANGUAGE))
-            options.keyword += ', language:{}'.format(LANGUAGE)
-        doujinshis = search_parser(options.keyword, sorting=options.sorting, page=options.page)
+        if constant.CONFIG['language']:
+            logger.info('Using default language: {0}'.format(constant.CONFIG['language']))
+            options.keyword += ' language:{}'.format(constant.CONFIG['language'])
+        doujinshis = search_parser(options.keyword, sorting=options.sorting, page=page_list,
+                                   is_page_all=options.page_all)

    elif not doujinshi_ids:
        doujinshi_ids = options.id
--- a/nhentai/constant.py
+++ b/nhentai/constant.py
@ -26,12 +26,12 @@ u = urlparse(BASE_URL)
 IMAGE_URL = '%s://i.%s/galleries' % (u.scheme, u.hostname)

 NHENTAI_HOME = os.path.join(os.getenv('HOME', tempfile.gettempdir()), '.nhentai')
-NHENTAI_PROXY = os.path.join(NHENTAI_HOME, 'proxy')
-NHENTAI_COOKIE = os.path.join(NHENTAI_HOME, 'cookie')
-NHENTAI_LANGUAGE = os.path.join(NHENTAI_HOME, 'language')
 NHENTAI_HISTORY = os.path.join(NHENTAI_HOME, 'history.sqlite3')
+NHENTAI_CONFIG_FILE = os.path.join(NHENTAI_HOME, 'config.json')

-PROXY = {}
+CONFIG = {
+    'proxy': {},
+    'cookie': '',
+    'language': '',
+}

-COOKIE = ''
-LANGUAGE = ''
--- a/nhentai/doujinshi.py
+++ b/nhentai/doujinshi.py
@ -48,6 +48,7 @@ class Doujinshi(object):

    def show(self):
        table = [
+            ["Parodies", self.info.parodies],
            ["Doujinshi", self.name],
            ["Subtitle", self.info.subtitle],
            ["Characters", self.info.characters],
--- a/nhentai/downloader.py
+++ b/nhentai/downloader.py
@ -5,11 +5,10 @@ import multiprocessing
 import signal

 from future.builtins import str as text
+import sys
 import os
 import requests
-import threadpool
 import time
-import multiprocessing as mp

 try:
    from urllib.parse import urlparse
@ -18,10 +17,10 @@ except ImportError:

 from nhentai.logger import logger
 from nhentai.parser import request
-from nhentai.utils import Singleton, signal_handler
+from nhentai.utils import Singleton

 requests.packages.urllib3.disable_warnings()
-semaphore = mp.Semaphore()
+semaphore = multiprocessing.Semaphore(1)


 class NHentaiImageNotExistException(Exception):
@ -133,16 +132,14 @@ class Downloader(Singleton):
        queue = [(self, url, folder) for url in queue]

        pool = multiprocessing.Pool(self.size, init_worker)
-
-        for item in queue:
-            pool.apply_async(download_wrapper, args=item, callback=self._download_callback)
+        [pool.apply_async(download_wrapper, args=item) for item in queue]

        pool.close()
        pool.join()


 def download_wrapper(obj, url, folder=''):
-    if semaphore.get_value():
+    if sys.platform == 'darwin' or semaphore.get_value():
        return Downloader.download_(obj, url=url, folder=folder)
    else:
        return -3, None
--- a/nhentai/parser.py
+++ b/nhentai/parser.py
@ -1,7 +1,6 @@
 # coding: utf-8
 from __future__ import unicode_literals, print_function

-import sys
 import os
 import re
 import time
@ -64,7 +63,7 @@ def _get_title_and_id(response):
    return result


-def favorites_parser(page_range=''):
+def favorites_parser(page=None):
    result = []
    html = BeautifulSoup(request('get', constant.FAV_URL).content, 'html.parser')
    count = html.find('span', attrs={'class': 'count'})
@ -78,6 +77,9 @@ def favorites_parser(page_range=''):
        return []
    pages = int(count / 25)

+    if page:
+        page_range_list = page
+    else:
        if pages:
            pages += 1 if count % (25 * pages) else 0
        else:
@ -89,9 +91,6 @@ def favorites_parser(page_range=''):
            pages = 1

        page_range_list = range(1, pages + 1)
-    if page_range:
-        logger.info('page range is {0}'.format(page_range))
-        page_range_list = page_range_parser(page_range, pages)

    for page in page_range_list:
        try:
@ -105,32 +104,6 @@ def favorites_parser(page_range=''):
    return result


-def page_range_parser(page_range, max_page_num):
-    pages = set()
-    ranges = str.split(page_range, ',')
-    for range_str in ranges:
-        idx = range_str.find('-')
-        if idx == -1:
-            try:
-                page = int(range_str)
-                if page <= max_page_num:
-                    pages.add(page)
-            except ValueError:
-                logger.error('page range({0}) is not valid'.format(page_range))
-        else:
-            try:
-                left = int(range_str[:idx])
-                right = int(range_str[idx + 1:])
-                if right > max_page_num:
-                    right = max_page_num
-                for page in range(left, right + 1):
-                    pages.add(page)
-            except ValueError:
-                logger.error('page range({0}) is not valid'.format(page_range))
-
-    return list(pages)
-
-
 def doujinshi_parser(id_):
    if not isinstance(id_, (int,)) and (isinstance(id_, (str,)) and not id_.isdigit()):
        raise Exception('Doujinshi id({0}) is not valid'.format(id_))
@ -178,7 +151,6 @@ def doujinshi_parser(id_):
    doujinshi['img_id'] = img_id.group(1)
    doujinshi['ext'] = ext

-    pages = 0
    for _ in doujinshi_info.find_all('div', class_='tag-container field-name'):
        if re.search('Pages:', _.text):
            pages = _.find('span', class_='name').string
@ -216,30 +188,39 @@ def print_doujinshi(doujinshi_list):
        return
    doujinshi_list = [(i['id'], i['title']) for i in doujinshi_list]
    headers = ['id', 'doujinshi']
-    logger.info('Search Result\n' +
+    logger.info('Search Result || Found %i doujinshis \n' % doujinshi_list.__len__() +
                tabulate(tabular_data=doujinshi_list, headers=headers, tablefmt='rst'))


-def search_parser(keyword, sorting, page):
-    logger.debug('Searching doujinshis using keywords {0}'.format(keyword))
-    keyword = '+'.join([i.strip().replace(' ', '-').lower() for i in keyword.split(',')])
+def search_parser(keyword, sorting, page, is_page_all=False):
+    # keyword = '+'.join([i.strip().replace(' ', '-').lower() for i in keyword.split(',')])
    result = []
+    if not page:
+        page = [1]
+
+    if is_page_all:
+        url = request('get', url=constant.SEARCH_URL, params={'query': keyword}).url
+        init_response = request('get', url.replace('%2B', '+')).json()
+        page = range(1, init_response['num_pages']+1)
+
+    total = '/{0}'.format(page[-1]) if is_page_all else ''
+    for p in page:
        i = 0
-    while i < 5:
+
+        logger.info('Searching doujinshis using keywords "{0}" on page {1}{2}'.format(keyword, p, total))
+        while i < 3:
            try:
-            url = request('get', url=constant.SEARCH_URL, params={'query': keyword, 'page': page, 'sort': sorting}).url
+                url = request('get', url=constant.SEARCH_URL, params={'query': keyword,
+                                                                      'page': p, 'sort': sorting}).url
                response = request('get', url.replace('%2B', '+')).json()
            except Exception as e:
-            i += 1
-            if not i < 5:
                logger.critical(str(e))
-                logger.warn('If you are in China, please configure the proxy to fu*k GFW.')
-                exit(1)
-            continue
+
            break

        if 'result' not in response:
-        raise Exception('No result in response')
+            logger.warn('No result in response in page {}'.format(p))
+            break

        for row in response['result']:
            title = row['title']['english']
--- a/nhentai/utils.py
+++ b/nhentai/utils.py
@ -20,9 +20,9 @@ def request(method, url, **kwargs):
    session.headers.update({
        'Referer': constant.LOGIN_URL,
        'User-Agent': 'nhentai command line client (https://github.com/RicterZ/nhentai)',
-        'Cookie': constant.COOKIE
+        'Cookie': constant.CONFIG['cookie']
    })
-    return getattr(session, method)(url, proxies=constant.PROXY, verify=False, **kwargs)
+    return getattr(session, method)(url, proxies=constant.CONFIG['proxy'], verify=False, **kwargs)


 def check_cookie():
@ -253,6 +253,26 @@ def signal_handler(signal, frame):
    exit(1)


+def paging(page_string):
+    # 1,3-5,14 -> [1, 3, 4, 5, 14]
+    if not page_string:
+        return []
+
+    page_list = []
+    for i in page_string.split(','):
+        if '-' in i:
+            start, end = i.split('-')
+            if not (start.isdigit() and end.isdigit()):
+                raise Exception('Invalid page number')
+            page_list.extend(list(range(int(start), int(end)+1)))
+        else:
+            if not i.isdigit():
+                raise Exception('Invalid page number')
+            page_list.append(int(i))
+
+    return page_list
+
+
 class DB(object):
    conn = None
    cur = None
--- a/setup.py
+++ b/setup.py
@ -23,7 +23,7 @@ setup(

    author=__author__,
    author_email=__email__,
-    keywords='nhentai, doujinshi',
+    keywords=['nhentai', 'doujinshi', 'downloader'],
    description='nhentai.net doujinshis downloader',
    long_description=long_description(),
    url='https://github.com/RicterZ/nhentai',
Author	SHA1	Message	Date
RicterZ	f04359e486	0.4.5	2020-10-11 01:57:37 +08:00
Ricter Zheng	6861cbcbc1	Merge pull request #166 from RicterZ/dev 0.4.4	2020-10-11 01:45:53 +08:00
Ricter Zheng	e0938c5a0e	Merge pull request #165 from RicterZ/dev 0.4.4	2020-10-11 01:43:41 +08:00
RicterZ	641f8e4c51	0.4.4	2020-10-11 01:42:02 +08:00
RicterZ	b2fae226f9	use config.json	2020-10-11 01:38:08 +08:00
RicterZ	f157ac3246	merge to functions	2020-10-11 01:09:13 +08:00
Ricter Zheng	139e01d3ca	Merge pull request #163 from Nontre12/dev-page-range Added --page-all option to download all search results	2020-10-11 00:58:57 +08:00
Ricter Zheng	4d870e36a1	Merge branch 'master' into dev-page-range	2020-10-11 00:53:27 +08:00
Ricter Zheng	74b0df26a9	Merge pull request #164 from RicterZ/fix-page-range fix page range issue #158	2020-10-11 00:51:58 +08:00
RicterZ	1746e731ec	fix page range issue #158	2020-10-11 00:48:36 +08:00
Nontre12	be05b9c0eb	Added --page-all option to download all search results	2020-10-10 18:29:00 +02:00
Ricter Zheng	9054b98934	Merge pull request #162 from Nontre12/master Added 'Parodies' output and Updated package version	2020-10-11 00:10:27 +08:00
Nontre12	b82201ff27	Added to -S --show option the "Parodies" output	2020-10-10 12:33:14 +02:00
Nontre12	532c74e075	Update __version__	2020-10-10 12:31:54 +02:00
Ricter Zheng	5a50a5b1ba	Merge pull request #159 from Nontre12/dev Added --clean-language option	2020-10-10 04:56:51 +08:00
Nontre12	b5fe48746e	Added --clean-language option	2020-10-09 17:34:03 +02:00
Nontre12	94d8da655a	Fix misspelling	2020-10-09 17:30:11 +02:00
Ricter Zheng	6ff2816d95	Merge pull request #157 from RicterZ/dev 0.4.3	2020-10-02 01:59:50 +08:00
Ricter Z	4d89b80e67	Merge branch 'dev' of github.com:RicterZ/nhentai into dev	2020-10-02 01:56:31 +08:00
Ricter Zheng	0a94ef9cf1	Merge pull request #156 from RicterZ/dev 0.4.2	2020-10-02 01:56:04 +08:00
Ricter Z	4cc4f35a0d	fix bug in search	2020-10-02 01:55:03 +08:00
Ricter Zheng	ad86c49de9	Merge branch 'master' into dev	2020-10-02 01:47:35 +08:00
Ricter Z	5a538fe82f	add tests and new python version	2020-10-02 01:43:44 +08:00
Ricter Z	eb35ba9848	0.4.2	2020-10-02 01:41:02 +08:00
Ricter Z	14a53a0953	fix	2020-10-02 01:39:42 +08:00
Ricter Z	c5e4b5ffa8	update	2020-10-02 01:39:14 +08:00
Ricter Z	b3f25875d0	fix bug on mac #126	2020-10-02 01:32:18 +08:00
Ricter Z	91053b98af	0.4.1	2020-10-02 01:02:41 +08:00
Ricter Zheng	b0902c2d58	Merge pull request #147 from fuchs2711/fix-win32-filename Fix invalid filenames on Windows	2020-07-19 11:12:25 +08:00
Fuzi Fuz	320f36c264	Fix invalid filenames on Windows	2020-07-18 15:19:41 +02:00
Ricter Zheng	1dae63be39	Merge pull request #141 from RicterZ/dev update tests	2020-06-26 13:32:35 +08:00
Ricter Zheng	8ed1b89277	Merge pull request #140 from RicterZ/dev 0.4.0	2020-06-26 13:16:55 +08:00