ImgScroll/src/main/java/com/rarchives/ripme/ripper/rippers/XhamsterRipper.java

package com.rarchives.ripme.ripper.rippers;

import java.io.IOException;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

import com.rarchives.ripme.ripper.AbstractHTMLRipper;
import com.rarchives.ripme.utils.Http;

public class XhamsterRipper extends AbstractHTMLRipper {

    public XhamsterRipper(URL url) throws IOException {
        super(url);
    }

    @Override
    public String getHost() {
        return "xhamster";
    }

    @Override
    public String getDomain() {
        return "xhamster.com";
    }

    @Override
    public URL sanitizeURL(URL url) throws MalformedURLException {
        String URLToReturn = url.toExternalForm();
        URLToReturn = URLToReturn.replaceAll("m.xhamster.com", "xhamster.com");
        URLToReturn = URLToReturn.replaceAll("\\w\\w.xhamster.com", "xhamster.com");
        URL san_url = new URL(URLToReturn.replaceAll("xhamster.com", "m.xhamster.com"));
        LOGGER.info("sanitized URL is " + san_url.toExternalForm());
        return san_url;
    }

    @Override
    public String getGID(URL url) throws MalformedURLException {
        Pattern p = Pattern.compile("^https?://[\\w\\w.]*xhamster\\.com/photos/gallery/.*?(\\d+)$");
        Matcher m = p.matcher(url.toExternalForm());
        if (m.matches()) {
            return m.group(1);
        }
        throw new MalformedURLException(
                "Expected xhamster.com gallery formats: "
                        + "xhamster.com/photos/gallery/xxxxx-#####"
                        + " Got: " + url);
    }


    @Override
    public Document getFirstPage() throws IOException {
        // "url" is an instance field of the superclass
        return Http.url(url).get();
    }

    @Override
    public boolean canRip(URL url) {
        Pattern p = Pattern.compile("^https?://[\\w\\w]*\\.xhamster\\.com/photos/gallery/.*?(\\d+)$");
        Matcher m = p.matcher(url.toExternalForm());
        return m.matches();
    }

    @Override
    public Document getNextPage(Document doc) throws IOException {
        if (!doc.select("a.next").first().attr("href").equals("")) {
            return Http.url(doc.select("a.next").first().attr("href")).get();
        } else {
            throw new IOException("No more pages");
        }
    }

    @Override
    public List<String> getURLsFromPage(Document doc) {
        List<String> result = new ArrayList<>();
        for (Element thumb : doc.select("div.picture_view > div.pictures_block > div.items > div.item-container > a > div.thumb_container > div.img > img")) {
            String image = thumb.attr("src");
            // replace thumbnail urls with the urls to the full sized images
            image = image.replaceAll(
                    "https://upt.xhcdn\\.",
                    "http://up.xhamster.");
            image = image.replaceAll("ept\\.xhcdn", "ep.xhamster");
            image = image.replaceAll(
                    "_160\\.",
                    "_1000.");
            // Xhamster has bad cert management and uses invalid certs for some cdns, so we change all our requests to http
            image = image.replaceAll("https", "http");
            result.add(image);
        }
        return result;
    }

    @Override
    public void downloadURL(URL url, int index) {
        addURLToDownload(url, getPrefix(index));
    }
}
Xhamster support 2014-03-14 04:26:23 +01:00			`package com.rarchives.ripme.ripper.rippers;`

			`import java.io.IOException;`
			`import java.net.MalformedURLException;`
			`import java.net.URL;`
Rewrote xhamster ripper to use mobile site 2017-11-23 06:18:09 +01:00			`import java.util.ArrayList;`
			`import java.util.List;`
Xhamster support 2014-03-14 04:26:23 +01:00			`import java.util.regex.Matcher;`
			`import java.util.regex.Pattern;`

			`import org.jsoup.nodes.Document;`
			`import org.jsoup.nodes.Element;`

Rewrote xhamster ripper to use mobile site 2017-11-23 06:18:09 +01:00			`import com.rarchives.ripme.ripper.AbstractHTMLRipper;`
Using new wrapper for HTTP requests, started abstract classes to simplify rippers 2014-06-22 02:08:42 +02:00			`import com.rarchives.ripme.utils.Http;`
Xhamster support 2014-03-14 04:26:23 +01:00
Rewrote xhamster ripper to use mobile site 2017-11-23 06:18:09 +01:00			`public class XhamsterRipper extends AbstractHTMLRipper {`
Xhamster support 2014-03-14 04:26:23 +01:00
			`public XhamsterRipper(URL url) throws IOException {`
			`super(url);`
			`}`

			`@Override`
Rewrote xhamster ripper to use mobile site 2017-11-23 06:18:09 +01:00			`public String getHost() {`
			`return "xhamster";`
Xhamster support 2014-03-14 04:26:23 +01:00			`}`

			`@Override`
Rewrote xhamster ripper to use mobile site 2017-11-23 06:18:09 +01:00			`public String getDomain() {`
			`return "xhamster.com";`
Xhamster support 2014-03-14 04:26:23 +01:00			`}`

			`@Override`
Rewrote xhamster ripper to use mobile site 2017-11-23 06:18:09 +01:00			`public URL sanitizeURL(URL url) throws MalformedURLException {`
			`String URLToReturn = url.toExternalForm();`
			`URLToReturn = URLToReturn.replaceAll("m.xhamster.com", "xhamster.com");`
			`URLToReturn = URLToReturn.replaceAll("\\w\\w.xhamster.com", "xhamster.com");`
			`URL san_url = new URL(URLToReturn.replaceAll("xhamster.com", "m.xhamster.com"));`
Changed logger to LOGGER 2018-06-03 03:14:41 +02:00			`LOGGER.info("sanitized URL is " + san_url.toExternalForm());`
Rewrote xhamster ripper to use mobile site 2017-11-23 06:18:09 +01:00			`return san_url;`
Xhamster support 2014-03-14 04:26:23 +01:00			`}`

			`@Override`
			`public String getGID(URL url) throws MalformedURLException {`
Rewrote xhamster ripper to use mobile site 2017-11-23 06:18:09 +01:00			`Pattern p = Pattern.compile("^https?://[\\w\\w.]xhamster\\.com/photos/gallery/.?(\\d+)$");`
Xhamster support 2014-03-14 04:26:23 +01:00			`Matcher m = p.matcher(url.toExternalForm());`
			`if (m.matches()) {`
Updated xhamster ripper to support new URL format Fixes 4pr0n/ripme#593 Fixes ripmeapp/ripme#4 2017-07-02 04:41:55 +02:00			`return m.group(1);`
Xhamster support 2014-03-14 04:26:23 +01:00			`}`
			`throw new MalformedURLException(`
			`"Expected xhamster.com gallery formats: "`
Updated xhamster ripper to support new URL format Fixes 4pr0n/ripme#593 Fixes ripmeapp/ripme#4 2017-07-02 04:41:55 +02:00			`+ "xhamster.com/photos/gallery/xxxxx-#####"`
Xhamster support 2014-03-14 04:26:23 +01:00			`+ " Got: " + url);`
			`}`

Rewrote xhamster ripper to use mobile site 2017-11-23 06:18:09 +01:00
			`@Override`
			`public Document getFirstPage() throws IOException {`
			`// "url" is an instance field of the superclass`
			`return Http.url(url).get();`
			`}`

			`@Override`
			`public boolean canRip(URL url) {`
XhamsterRipper now accepts all countries subdomains 2018-06-15 04:18:17 +02:00			`Pattern p = Pattern.compile("^https?://[\\w\\w]\\.xhamster\\.com/photos/gallery/.?(\\d+)$");`
Rewrote xhamster ripper to use mobile site 2017-11-23 06:18:09 +01:00			`Matcher m = p.matcher(url.toExternalForm());`
Replaced the if-else statement by a single return statement. Replaced use of Collection.size () by Collection.isEmpty () in ViddmeRipper. 2018-05-31 15:21:44 +02:00			`return m.matches();`
Rewrote xhamster ripper to use mobile site 2017-11-23 06:18:09 +01:00			`}`

			`@Override`
			`public Document getNextPage(Document doc) throws IOException {`
Some minor code clean up 2018-04-19 17:35:36 +02:00			`if (!doc.select("a.next").first().attr("href").equals("")) {`
Rewrote xhamster ripper to use mobile site 2017-11-23 06:18:09 +01:00			`return Http.url(doc.select("a.next").first().attr("href")).get();`
			`} else {`
			`throw new IOException("No more pages");`
			`}`
			`}`

			`@Override`
			`public List<String> getURLsFromPage(Document doc) {`
			`List<String> result = new ArrayList<>();`
			`for (Element thumb : doc.select("div.picture_view > div.pictures_block > div.items > div.item-container > a > div.thumb_container > div.img > img")) {`
			`String image = thumb.attr("src");`
			`// replace thumbnail urls with the urls to the full sized images`
			`image = image.replaceAll(`
			`"https://upt.xhcdn\\.",`
			`"http://up.xhamster.");`
			`image = image.replaceAll("ept\\.xhcdn", "ep.xhamster");`
			`image = image.replaceAll(`
			`"_160\\.",`
			`"_1000.");`
			`// Xhamster has bad cert management and uses invalid certs for some cdns, so we change all our requests to http`
			`image = image.replaceAll("https", "http");`
			`result.add(image);`
			`}`
			`return result;`
			`}`

			`@Override`
			`public void downloadURL(URL url, int index) {`
			`addURLToDownload(url, getPrefix(index));`
			`}`
			`}`