/ Forside / Teknologi / Udvikling / PHP / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
PHP
#NavnPoint
rfh 3959
natmaden 3372
poul_from 3310
funbreak 2700
stone47 2230
Jin2k 1960
Angband 1743
Bjerner 1249
refi 1185
10  Interkril.. 1146
Remote Content Retrieval
Fra : Mark Andersen


Dato : 15-10-01 13:45

Hej NG!

For det første vil jeg gerne gøre det klart at jeg er helt grøn hvad angår
PHP. derfor skriver jeg her i håb om hjælp! =)

Jeg har en hjemmeside hvor der er en film liste med titler på.. lige nu har
jeg bare lavet et link til imdb.com på den givne titel
så feks: Along came a spider (linker til) us.imdb.com/Title?0164334

men nu jeg istedet vha php eller måske cgi hente siden og kun udtage de ting
jeg har brug for som f.eks. imdb's user rating..

jeg har prøvet at redigere forskellige scripts sådan at de ku gå ind og
hente siden og filtre de ting ud jeg vil ha..
men imdb vil umiddelbart ikke godtage den request som scriptet laver..
det jeg sender til den ligner er det her:
---
if($sock = fsockopen($host, $port)) {
set_socket_blocking($sock, 0);
switch($proto) {
case "HTTP/1.1":
set_socket_blocking($sock, 1);
fputs($sock, sprintf("GET %s %s\n",
$path, $proto));
fputs($sock, sprintf("Host: %s\n\n",
$host));
fputs($sock, sprintf("User-Agent: Mozilla/4.0
(compatible; MSIE 6.0; Windows NT 5.1\n\n)", $host));
fputs($sock,
sprintf("Connection:close\n\n", $host));
break;
---

Jeg får en fejl 403 access denied af imdb og en masse forslag til hvad der
gik galt i mit output..
bla at det kan være fordi jeg ik sender en user-agent i headeren.. men der
har jeg sat på.. og det virker stadig ikke..

er der nogen derude som ved hvordan dette skal omgåes, eller endnu bedre,
nogen som har et script som kan tage text fra sider som imdb?

mvh
/mark



 
 
Peter Brodersen (15-10-2001)
Kommentar
Fra : Peter Brodersen


Dato : 15-10-01 15:29

On Mon, 15 Oct 2001 14:45:22 +0200, "Mark Andersen" <mark@b4zz.dk>
wrote:

>Jeg får en fejl 403 access denied af imdb og en masse forslag til hvad der
>gik galt i mit output..
>bla at det kan være fordi jeg ik sender en user-agent i headeren.. men der
>har jeg sat på.. og det virker stadig ikke..

IMDb foreslår, at du får en "Forbidden", fordi du prøver at hapse
deres indhold ud af kontekst. Og det er jo egentligt også det, du
prøver på, ikke sandt?



Hvis du virkelig vil omgå det, kan du forsøge med en mere normal
User-Agent. Hvis det bare er grunddata, så kig på
http://www.imdb.com/interfaces der nok kan hjælpe.

--
- Peter Brodersen

Søg
Reklame
Statistik
Spørgsmål : 177560
Tips : 31968
Nyheder : 719565
Indlæg : 6408942
Brugere : 218888

Månedens bedste
Årets bedste
Sidste års bedste