Freitag, 24. September 2010

Header Daten einer HTML Seite auslesen

Die Klassen WebRequest und WebResponse stellen gewissermaßen einen erweiterten WebClient dar, sie können dazu benutzt werden, um über das HTTP Protokoll Anfragen an bestimmte Seiten zu senden und Antworten auszulesen.
Unter anderem können damit auch sehr leicht die Header Elemente einer HTML Seite ausgelesen werden.
Das folgende Beispiel sollte eigentlich selbsterklärend sein, es ist eine Konsolenanwendung, die die Header Daten von diesem Blog ausliest (using System.Net vorrausgesetzt):

        static void Main(string[] args)
        {
            WebRequest HeaderRequest = HttpWebRequest.Create("http://csharp-tricks.blogspot.com/");
            WebResponse HeaderResponse = HeaderRequest.GetResponse();

            foreach (string HeaderKey in HeaderResponse.Headers)
            {
                Console.WriteLine(HeaderKey + ": " + HeaderResponse.Headers[HeaderKey]);
            }
        }

Das Ergebnis sieht folgendermaßen aus:

X-Content-Type-Options: nosniff
X-XSS-Protection: 1; mode=block
Transfer-Encoding: chunked
Cache-Control: private
Content-Type: text/html; charset=UTF-8
Date: Fri, 24 Sep 2010 18:33:03 GMT
Expires: Fri, 24 Sep 2010 18:33:03 GMT
ETag: "fb52caee-c1f0-4f4a-8caa-de7e4de4dfaa"
Last-Modified: Fri, 24 Sep 2010 18:31:27 GMT
Set-Cookie: blogger_TID=9919beb7f2e6b1c8; Domain=.blogger.com; HttpOnly
Server: GSE

Keine Kommentare:

Kommentar veröffentlichen