Seite 1 von 2 12 LetzteLetzte
Ergebnis 1 bis 10 von 11
  1. #1
    Anfänger
    Registriert seit
    25.10.2011
    Beiträge
    17

    Standard komplette Internetseite crawlen (z.b. Warezseite)

    Hey zusammen, kann mir jemand erklären wie/ob es möglich ist ein komplette Internetseite offfline verfügbar zu machen? zum Beispiel eine warezseite, damit, falls sie mal down ist, man die ganzen Links noch zur verfügung hat.

    Oder schützen sich die Webseitenbetreiber davor, wenn ja wie ist es zu umgehen.

    Habe mal son nen Webspider(Xaldon webspider[windows]) ausprobiert, hat aber keine brauchbaren ergebnisse ausgespuckt, hat mir nur die Index.php geliefert.

    N tut wär nice oder n Tip welches Progarmm das gut beherrscht (win, linux).

    danke und peaCe

  2. #2
    W32.FunLove Avatar von Death~
    Registriert seit
    17.10.2011
    Beiträge
    134

    Standard AW: komplette Internetseite crawlen (z.b. Warezseite)

    Du kannst dir den Quelltext von jeder Datei, auf die du Zugriff hast, speichern. Dynamische Seiten werden dann wahrscheinlich nicht mehr funktionieren. Das heißt du kannst dir lediglich das Ganze visuell darstellen lassen. Wenn diese dann noch mit einer Datenbank kommunizieren und du diese nicht hast, wird das auch problematisch.
    Lord, what fools these mortals be


  3. #3
    Fortgeschrittener
    Registriert seit
    23.11.2010
    Beiträge
    47

    Standard AW: komplette Internetseite crawlen (z.b. Warezseite)

    Ich weis nicht ob dir das was bringt,
    ich nutze oft dieses Tool hier:


    HTTrack Website Copier 3.44-4

    http://www.heise.de/software/downloa...te_copier/2320

  4. #4
    Anfänger
    Registriert seit
    25.10.2011
    Beiträge
    17

    Standard AW: komplette Internetseite crawlen (z.b. Warezseite)

    jo danke ich schau mir mal den HTTrack an, der läuft grad, mal schaun ob der gute ergebnisse liefert.

    bis dann

  5. #5
    Capt'n Crunch
    Registriert seit
    10.07.2008
    Beiträge
    999

    Standard AW: komplette Internetseite crawlen (z.b. Warezseite)

    man wget
    bitcoin. Banking Is Necessary. Banks Are Not. - by Lincoln6Echo

    Das ganze Mysql usw is mir zu viel arbeit um es zu lernen

  6. Folgende Benutzer haben sich für diesen Beitrag bedankt:

    feVer (12.02.2012), N4dja (08.02.2012)

  7. #6
    NoClose Wurm
    Registriert seit
    26.10.2008
    Beiträge
    185

    Standard AW: komplette Internetseite crawlen (z.b. Warezseite)

    Beim Crawlen einer Homepage besteht immer das Problem das er (der Crawler) sozusagen nur die Daten bekommt, auf die auch selbst verlinkt werden. Wenn z.b ein Ordner namens /admin/ exestiert, er aber in keiner html datei darauf verlinkt z.b, dann findet er das nicht. Zusätzlich kann er keinen Php Code crawlen weil der Code Serverseitig Ausgeführt wird, es klappen also nur interpreter sprachen die lokal im browser ausgeführt werden zum crawlen. Passwortgeschützt Seiten kannst du ohne Password/Zugang z.b dann auch garnicht Crawln.

    mfg

  8. #7
    VergeCurrency Avatar von Yakuza112
    Registriert seit
    10.07.2008
    Beiträge
    398

    Standard AW: komplette Internetseite crawlen (z.b. Warezseite)

    Scrapbook Plus, allerdings kann es auch sein das du von der Firewall geblockt wirst ..

    ++ Frage, kennt wer nen crawler für webseiten wo ich mich einloggen muss ?


    ¥akuza112 Inc. © 2008
    Dein Neid ist meine Anerkennung und Dein Hass ist mein Stolz.Wenn Du hinter meinem Rücken über mich redest, danke ich Dir,dass Du mich zum Mittelpunkt Deines Lebens machst

  9. #8
    Capt'n Crunch
    Registriert seit
    10.07.2008
    Beiträge
    999

    Standard AW: komplette Internetseite crawlen (z.b. Warezseite)

    Surflam das was du sagst ist richtig, aber irgendwie trotzdem eher .... selbstverständlich
    bitcoin. Banking Is Necessary. Banks Are Not. - by Lincoln6Echo

    Das ganze Mysql usw is mir zu viel arbeit um es zu lernen

  10. #9
    W32.Lovgate
    Registriert seit
    05.11.2008
    Beiträge
    367

    Standard AW: komplette Internetseite crawlen (z.b. Warezseite)

    @Yakuza, ich mein bei HTTrack hast auch ein Möglichkeit deine Logindaten einzugeben, also solltest dich damit auf Webseiten auch authen können.

  11. Folgende Benutzer haben sich für diesen Beitrag bedankt:

    Yakuza112 (12.02.2012)

  12. #10
    NoClose Wurm
    Registriert seit
    26.10.2008
    Beiträge
    185

    Standard AW: komplette Internetseite crawlen (z.b. Warezseite)

    @Hu5el normalerweise sollte das selbstverständlich sein ja, aber es gibt genug die immer wieder mit der Frage "kann ich damit Php dateien von andern klauen?" kommen..wollte dem vorbeugen :p

Seite 1 von 2 12 LetzteLetzte

Ähnliche Themen

  1. Komplette VM -> Tor
    Von Nookie im Forum Anonymität & Proxies
    Antworten: 3
    Letzter Beitrag: 06.02.2012, 22:16

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •