From: Fredrik Tolf <fredrik@dolda2000.com>
Date: Mon, 13 Jan 2020 00:26:21 +0000 (+0100)
Subject: Added kakalot library.
X-Git-Url: http://git.dolda2000.com/gitweb/?a=commitdiff_plain;h=b60d34a70d5578e50232db9718f029021d3927a7;p=automanga.git

Added kakalot library.
---

diff --git a/manga/kakalot.py b/manga/kakalot.py
new file mode 100644
index 0000000..96a7c28
--- /dev/null
+++ b/manga/kakalot.py
@@ -0,0 +1,110 @@
+import bs4
+from urllib.parse import urljoin
+from . import lib, htcache
+soup = bs4.BeautifulSoup
+soupify = lambda cont: soup(cont, "html.parser")
+
+class page(lib.page):
+    def __init__(self, chapter, stack, n, url):
+        self.stack = stack
+        self.chapter = chapter
+        self.manga = chapter.manga
+        self.n = n
+        self.id = str(n)
+        self.name = "Page %s" % (n + 1,)
+        self.iurl = url
+
+    def open(self):
+        return lib.stdimgstream(self.iurl)
+
+    def __str__(self):
+        return self.name
+
+    def __repr__(self):
+        return "<kakalot.page %r.%r.%r>" % (self.manga.name, self.chapter.name, self.name)
+
+class chapter(lib.pagelist):
+    def __init__(self, manga, stack, id, name, url):
+        self.stack = stack
+        self.manga = manga
+        self.id = id
+        self.name = name
+        self.url = url
+        self.cpag = None
+
+    def __getitem__(self, i):
+        return self.pages()[i]
+
+    def __len__(self):
+        return len(self.pages())
+
+    def pages(self):
+        if self.cpag is None:
+            pg = soupify(htcache.fetch(self.url))
+            pag = []
+            for n, img in enumerate(pg.find("div", id="vungdoc").findAll("img")):
+                url = urljoin(self.url, img["src"])
+                pag.append(page(self, self.stack + [(self, n)], n, url))
+            self.cpag = pag
+        return self.cpag
+
+    def __str__(self):
+        return self.name
+
+    def __repr__(self):
+        return "<kakalot.chapter %r.%r>" % (self.manga.name, self.name)
+
+class manga(lib.manga):
+    def __init__(self, lib, id, name, url):
+        self.lib = lib
+        self.id = id
+        self.name = name
+        self.url = url
+        self.cch = None
+        self.stack = []
+
+    def __getitem__(self, i):
+        return self.ch()[i]
+
+    def __len__(self):
+        return len(self.ch())
+
+    def ch(self):
+        if self.cch is None:
+            page = soupify(htcache.fetch(self.url))
+            cls = page.find("div", attrs={"class": "chapter-list"})
+            cch = []
+            for row in reversed(cls.findAll("div", attrs={"class": "row"})):
+                link = row.find("a")
+                url = urljoin(self.url, link["href"])
+                p1 = url.rfind("/")
+                p2 = url.rfind("/", 0, p1 - 1)
+                if p1 < 0 or p2 < 0 or url[p2 + 1 : p1] != self.id:
+                    raise Exception("unexpected chapter url: %s" % (url,))
+                cid = url[p1 + 1:]
+                if len(cid) < 1:
+                    raise Exception("unexpected chapter url: %s" % (url,))
+                name = link.string
+                cch.append(chapter(self, [(self, len(cch))], cid, name, url))
+            self.cch = cch
+        return self.cch
+
+    def __str__(self):
+        return self.name
+
+    def __repr__(self):
+        return "<kakalot.manga %r>" % self.name
+
+class library(lib.library):
+    def __init__(self):
+        self.base = "https://mangakakalot.com/"
+
+    def byid(self, id):
+        url = urljoin(self.base + "manga/", id)
+        page = soupify(htcache.fetch(url))
+        ul = page.find("ul", attrs={"class": "manga-info-text"})
+        if ul is None: raise KeyError(id)
+        name = ul.li.h1
+        if name is None: raise KeyError(id)
+        name = name.string
+        return manga(self, id, name, url)