PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Szenereleasetitel verarbeiten



freaki
24.05.2010, 22:01
Hallo Leute,

ich hab hier ein kleines Problemchen.
Ich hab schon in Google danach gesucht, aber die threads dort haben mir nicht weitergeholfen, weil sie entweder nicht vorhanden oder geclosed worden sind.

Also es geht darum.
Ihr kennt ja sicherlich diese Releasetitel von Filmen bspw. "Prince.Of.Persia.R5.Line.Dubbed.German.XviD-VCF". Ich möchte aus diesen Releasetiteln die Titel der eigentlichen Filme extrahieren.

Habt ihr dafür nen Ansatz parat?

Ich hab bis jetzt nur ne Blacklist im Kopf gehabt. Aber damit bekomme ich bspw. Jahreszahlen nicht heraus, weil ich dann Problem mit Filmen wie 2010 bekäme.

Egal, was euch einfällt. Immer her damit.

Atropos
24.05.2010, 22:32
Naja du kannst es billig mit einen array machen und alle strings aus dem array vom Titel löschen.
Im Array stehen dann halt die bekannten Wörter wie 2010,2009,2008,...,Xvid,MPEG,DVD-Rip, usw

Wäre meine Idee.

Hidden99
24.05.2010, 23:28
Ich denk mal mit Blacklist klappts nicht angenommen morgen wird ein Film raus gebracht
der Line heißt dann hast n Problem...Eine Möglichkeit wäre es z.B. eine Funktion zu machen
mit der User der website fehelrhafte Erkennungen Markieren können...
Ne andere Möglichkeit wäre es den Namen des Releases mit einer Riesigen Datenbank an
Film Namen abzugleichen und das mit dem ähnlichsten Namen einfach zu benutzen

100
24.05.2010, 23:44
Die Nachteile der Blacklist hast du schon erkannt.. also eine Möglichkeit wäre es, Begriffe wie "R5" samt "." vorne und hinten zu löschen.

Dann könntest du für Blacklist-Wörter noch eine Whitelist erstellen. Zum Beispiel: Lösche "line" nicht, wenn ".dubbed", .. dahiner steht.

Was anderes fällt mir nicht ein.. außer bei deinen Warez hat jede Eigenschaft immer eine bestimmte Position. Dann könnte man sagen, dass die Blacklist-Funktion erst anfangen soll, sobald ein Wort "R5", .. gefunden wurde.

freaki
24.05.2010, 23:55
@compi:
Das ist ja die Blacklist-Idee, die nicht universell anwendbar ist auf Grund von Filmen wie 2012 oder z.b. "Walk the Line", um mal das Beispiel von Hidden zu ergänzen.

@hidden:
Das mit der Userfunktion ist ne super Idee. Das notiere ich mir gleich ^^
Mit riesiger Filmdatenbank meinst du sicherlich imD*.com oder? ^^ Die haben ja einen FTP von dem man sich die Daten holen kann. Allerdings will ich mir im Nachhinein auch noch ein paar Infos holen, die nicht in auf deren FTP liegen. Plots auf Deutsch z.B..
Naja, dann bleibt mir wohl nichts übrig, als die FTP-Daten regelmäßig einzulesen und sie in meiner lokalen DB zu speichern. somit habe ich wohl auch den schnellsten Zugriff darauf, nech?

@100:
hehe ^^ du hast nen kleinen Fehler drin. "Line" sollte ja gerade dann gelöscht werden, wenn dahinter "dubbed" steht^^
Das Problem ist auch, dass die Releasenamen nicht regelmäßig sind. Kennt ihr ja, dass da mal so was steht und dann mal was anderes. Macht halt jede Group anders.

100
24.05.2010, 23:57
Entschuldige, dann drehste das halt um und dann funktioniert es wieder ;)