Ergebnis 1 bis 2 von 2
  1. #1
    Anfänger
    Registriert seit
    28.03.2020
    Beiträge
    9

    Standard Python | html oder text datei nach bestimmten zeichen durchsuchen

    hey liebe community,

    ich habe eine html datei und möchte diese durchsuchen undzwar nach ganz bestimmten zeichen oder buchstaben ein beispiel:

    ´<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
    "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
    <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="de">
    <head>
    <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
    <meta id="e_vb_meta_bburl" name="vb_meta_bburl" content="https://free-hack.com" />
    <base href="https://free-hack.com/" /><!--[if IE]></base><![endif]-->
    <meta name="generator" content="vBulletin" />

    <link rel="Shortcut Icon" href="favicon.ico" type="image/x-icon" />


    mal angenommen das oben ist meine html datei. und ich möchte das mein programm
    alle zeichen buchstaben und zahlen zwischen von mir festgelegten zeichen abspeichert.
    mal angenommen ich lege das wort name und dieses " zeichen fest und will dass wenn
    sich diese nebeneinander irgendwo befinden dass dazwischen alles in einer weiteren
    textdatei abspeichert wird im obigen fall wäre der Output das Gleichheitszeichen =.

    Stichwort: grep


    lieber html datei durchsuchen oder diese in eine txt datei umwandeln und diese durchsuchen ?


    vielen dank schonmal

    mfg 0u1law
    Geändert von 0u1law (07.08.2020 um 22:11 Uhr)

  2. #2
    Sobig Wurm
    Registriert seit
    03.07.2015
    Beiträge
    201

    Standard AW: Python | html oder text datei nach bestimmten zeichen durchsuchen

    Also wenn es nur darum geht diese Zeichen abzugreifen, solltest du Regex verwenden. In diesem Fall wäre das dann:
    Code:
    import re
    pattern = '"(.*?)"'
    string = 'dein html'
    #sollte ein Liste mit allen Matches ergeben
    result = re.findall(pattern, string)
    Für die Erklärung des Pattern empfehle ich einfach mal auf https://regex101.com/ zu gehen und es dort einzugeben.

    Wenn du noch mehr mit dem HTML machst als nur das empfehle ich einen richtigen Parser. Kommt natürlich immer drauf an, was man macht. Wenn du wirklich nur diese Strings brauchst ist Regex genau passend dafür und n Parser wäre n overkill. Wann und warum du was verwenden solltest, findest du eigentlich viel online. Hier ein paar Threads auf Stackoverflow:

    https://stackoverflow.com/questions/...lanation-in-la

    https://stackoverflow.com/questions/...e-html-why-not

    https://stackoverflow.com/questions/...contained-tags

Ähnliche Themen

  1. [Python] Text Tipp Script by Me
    Von PancakeBear im Forum Python
    Antworten: 12
    Letzter Beitrag: 13.10.2010, 21:25
  2. [C/C++] Datei durchsuchen
    Von luxury11 im Forum C, C++
    Antworten: 3
    Letzter Beitrag: 03.06.2010, 22:31
  3. [F] PC nach Datei-typ durchsuchen?
    Von Megagamer im Forum Delphi
    Antworten: 4
    Letzter Beitrag: 17.07.2009, 00:16
  4. Antworten: 8
    Letzter Beitrag: 03.05.2009, 18:22
  5. suche nach einem bestimmten script php oder html
    Von xhacker-scripterx im Forum PHP
    Antworten: 2
    Letzter Beitrag: 15.11.2007, 20:44

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •