XML Sitemap – Netzwerk nicht erreichbar

Seit meinen Umzug des Promiblogs InTrash auf die eigene Domain, habe ich Probleme mit meiner XML Sitemap. Zur Erstellung der Sitemap nutze ich das Plugin Dagon Design Sitemap Generator.

Das Plugin verwende ich auch auf allen meinen anderen Blogs ohne jegliche Probleme. Nur auf InTrash scheint es damit ein Problem zu geben. Die Sitemap wird zwar von Google gefunden, aber keiner der Einträge wird indiziert. Unter Details bekomme ich ständig die Meldung “Netzwerk nicht verfügbar”. Rufe ich die URLs direkt auf, funktioniert alles Bestens.

Eine Überprüfung der Sitemap über die Google Webmaster-Tools meldet mir eine erfolgreiche Übertragung mit dem Status HTTP/1.1 200 OK.

Die Sitemap selbst habe ich auch bereits einige Male im FTP-Verzeichnis vollständig gelöscht und neu erstellt. Anschließend neu an Google gemeldet, aber immer wieder mit dem selben negativen Ergebnis.

Weiß jemand von euch Rat, wo ich noch etwas überprüfen könnte? Ich selbst bekomme das einfach nicht in den Griff. Wirklich hilfreiches konnte ich im Netz zu dem Thema leider auch nicht finden :-( .

Über Majeres

Hallo lieber Besucher, hier bloggt Andreas, stolzer Saarländer, passionierter Motorradfahrer und Hobbyfotograf. +Andreas Majeres Kontakt: Facebook | Twitter | Google+ | YouTube | Weitere Artikel

36 Kommentare zu XML Sitemap – Netzwerk nicht erreichbar

  1. Ich hatte das vor einiger Zeit auch, bei mir hat das ne ganze Weile gedauert, bis nach der Fehlerbehebung diese Meldungen verschwunden sind. Beobachte das mal ein paar Tage und schau, ob wie sich die Anzahl verändert. Anfangs sinds bei mir nur wenige unterschied gewesen, dann warens von einen auf den anderen Tag plötzlich rund 10k weniger.
    Viele Grüße,
    Uli

  2. Und dein Kommentar-Plugin hat grad meinen Namen wegradiert ;) Ich glaube “Name (benötigt)” auf der WordPress-Blacklist würde solche Falscheingaben verhindern ;)
    Viele Grüße,
    Uli

  3. @Uli: Ich beobachte das ja schon die ganzen Wochen seit dem Umzug. Da tut sich leider gar nichts. Nicht eine einzige URL wurde indiziert :-( . Ich kann einfach nicht herausfinden warum das so ist.

    Wenn ich “Name (benötigt)” in die Blacklist setze, ist es dann nicht so, dass der Kommentar direkt im Spam landet? Habe damit Null Erfahrung ;-) .

  4. @Andreas: Okay, das ist aber echt komisch. Ne das weiß ich leider auch ne weiter. Allerdings findet man dich auch in Google noch nicht unter der neuen Domain, das indizieren scheint also tatsächlich nicht zu laufen (also nicht dass evtl. nur nen Anzeigefehler ist).

    Die Blacklist-Funktion hab ich noch net genutzt, daher weiß ichs auch net. Ausprobieren, würd ich sagen ;) Aber bei Rückkehr auf die Seite wird alles korrekt ausgefüllt…bis eben auf den Namen, dort steht “Name (benötigt)”, obwohl ich ja noch einen korrekten Kommentar geschrieben hatte :(

    Viele Grüße,
    Uli

  5. Also irgendwas läuft da definitiv schief. Wenn ich das bei Google richtig sehe (http://www.google.de/#hl=de&q=site%3Ahttp%3A%2F%2Fintrash.com%2F&meta=&aq=&aqi=&aql=&oq=&gs_rfai=&fp=af20d2721f07b915) hast Du ausschließlich nur Tags im Index.
    Die Sitemap selbst sieht aber gut aus (ist übrigens ein anderes als das von Dir oben im Artikel erwähnte Plugin. Das was Du nutzt (ich ja auch) heißt Google XML Sitemaps und ist von Arne Brachhold.

    Ich hab gerade mal ein bißchen danach gesucht. Sieht so aus, als müsstest Du mit Deinem Provider reden, vielleicht hat der Google ausgesperrt oder so. Oder Du sperrst ihn – der mit allen möglichen Kennungen daher kommt und nicht immer identifizierbar ist – mit einer Deiner hunderten disallow Einträgen in der robots.txt selbst aus.
    Siehe hier: ‘http://groups.google.com/group/google_webmaster_help-tools-de/browse_thread/thread/685b876d43d390b0′
    und hier: ‘http://www.google.com/support/forum/p/webmasters/thread?tid=67997c9e82a614f3&hl=de’

  6. Mal schnell auf der Konsole:

    wget -U “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)” http://intrash.com/dsds-2010-der-gewinner-ist-mehrzad-marashi
    –2010-04-19 20:41:52– http://intrash.com/dsds-2010-der-gewinner-ist-mehrzad-marashi
    Resolving intrash.com… 212.90.148.17
    Connecting to intrash.com|212.90.148.17|:80… connected.
    HTTP request sent, awaiting response… 500 Internal Server Error
    2010-04-19 20:41:53 ERROR 500: Internal Server Error.

    …heißt auf deutsch, wenn du dich als “google bot” als useragent identifizierst, dann liefert dein server ein error 500.

    Probier das mal aus, im Firefox kann man ja auch den Useragent ändern… Dann guck ins apache error_log, was der Error 500 genau ist. Meinen müsstest du da auch finden…

  7. PS: Fisch meinen Comment aus dem Spamordner, der hatte wohl zuviele links :-))

  8. Das hört sich ganz komisch an, hatte ich noch nie.

    Was ich machen würde:

    - Mit dem Hoster bezüglich Konfigurationsänderungen reden.
    - Robots.txt testweise leeren.

  9. PPS: Als Ergänzung zu meinem Kommentar im Spamordner *g*

    Die Startseite funktioniert, also hast Du IMHO ein Problem bei mod_rewrite?!

  10. @Marc Wie kommst Du auf mod_rewrite? Die Seite läuft doch wunderbar.

  11. Grrr, dieser faule Hund gibt meinen ersten Kommentar einfach nicht frei… lach…

    Also… änder den Useragent in deinem Browser in den vom Google Bot.
    Dann erhälst Du bei jedem Artikel einen Error 500 – die Startseite funktioniert aber.
    Also tippe ich mal ins Blaue, dass irgendein Plugin anhand des User-Strings irgendwas anders macht und somit auch die permalinks oder sowas beinflusst…

  12. Erstmal Danke an alle für das zahlreiche Feedback!

    @Uli: Einen Versuch werde ich wagen :-) .

    @Tanja: Die beiden Threads kenne ich, aber die konnten mir nicht wirklich weiterhelfen. Bezüglich der robots.txt werde ich einmal eine leere erstellen. Mal sehen, ob sich was ändert.
    Un Hoppla, das Plugin. Das hat man davon, wenn man sich auf sein schlechtes Gedächtnis verlässt und nicht noch mal nachschaut ;-) .

    @Marc: Hehehe, fauler Hund :mrgreen: . (Hast recht, habe da schon mit den Kids auf der Couch rumgelümmelt oder vielmehr getobt :-) . Mir tun die Knochen noch weh. Leon ist ein angehender Kickboxer. Das hohe Knie beherrscht er schon richtig gut.)

    Einen Errorlog kann ich bei Goneo nicht einsehen :-( . Anhand deiner Feststellung könnte es aber tasächlich an der robots.txt liegen. Komisch ist nur, dass ich sie so auch hier verwende und keine Probs habe.
    mod_rewrite könnte es eventuell sein, aber die Änderung der Permalinks hatte funktioniert. Dafür ist meines Wissens doch auch mod_rewrite nötig?

    @Jeffrey: Sollte die Änderung der robots.txt nichts bringen, werde ich deiner Empfehlung den Hoster anzufunken nachkommen :-) . Das wäre dann der Verzweiflungsakt ;-) .

  13. Ja, Marc hat Recht und im Prinzip sagen das auch die beiden Threats aus. Kuck mal auf web-sniffer.net, gibt dort eine URL eines Deiner Beiträge ein und wähle als UserAgent GoogleBot aus. Dann erscheint:
    Status: HTTP/1.1 500 Internal Server Error

    Entweder ist was an der robots.txt faul, irgendwas in der htaccess drinne oder eine Einstellung direkt am Server spinnt. Für letzteres hilt nur der Hoster…

  14. Wenn ich kurz einwerfen darf: Internal Server Error kommt von der Webserversoftware und hat nichts mit der robot.txt zu tun. Es kann auch gut sein, dass ein Plugin dich so “foppen” will. Wenn du die Möglichkeit hast, dann stelle dein Blog evtl. unter einer Testdomain nochmals bereit und teste mal verschiedenes durch (Plugins deaktivieren usw).
    Übrigens: Wenn man auf http://web-sniffer.net/ geht und wie bei CrazyGirl vorgeschlagen einen Beitrag nimmt und dort einträgt, kann man da wunderbar testen, außer, dass JEDER gewählte UserAgent einen 500-Fehler bringt :/ Sieht man sich die Seite mit dem Plugin (Firefox) “FireBug” an, so sieht man auch darin bei jeder Seite einen 500 Internal Server Error, OBWOHL die Seite im Anschluss dann doch ausgeliefert wird. Da ist was oberfaul…
    Ich würde nun als erste Maßnahme den Hoster ansprechen ;)
    Viele Grüße,
    Uli

  15. @Uli: Stimmt, im Firebug sieht das auch gruselig aus. Ich würde glaube ich auch als erstes mal den Hoster drüber kucken lassen. Der Server packt da irgendwas nicht und die Frage ist was…

  16. …scheint auf jeden Fall was mit mod_rewrite zu sein:
    Wenn ich einen Artikel über die normale URL aufrufe (z.B. intrash.com/?p=47 ) klappt es einwandfrei, wenn ich die “richtige”, umgeschriebene URL mit dem Artikelname verwende, gibt’s E500.

  17. @all: An der robots.txt liegt es nicht. Die habe ich bereits geändert, aber ohne Erfolg. Sollte es tatsächlich an der mod_rewrite liegen?
    Hier mal die hataccess für euch Fachleute.


    RewriteEngine on
    RewriteCond %{HTTP_HOST} !^intrash\.com$
    RewriteRule ^(.*)$ http://intrash.com/$1 [L,R=301]

    # BEGIN WordPress

    RewriteEngine On
    RewriteBase /
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule . /index.php [L]

    # END WordPress

  18. Für was hast Du denn den ersten Teil drinne? Der Sinn erschließt sich mir nicht so ganz, auch nicht was das genau tun soll (so der große Peiler bzgl. htaccess bin ich aber auch nicht).
    Schalte den ersten Teil doch mal aus (Zeile 1 bis 5 jeweils ein # davor und kuck über web-sniffer.net nach, was bei den Artikeln etc. für Headers kommen bei den unterschiedlichen User Agents.

  19. @Tanja: Der erste Teil soll eigentlich die dauerhafte Umleitung von www auf ohne www sein. Kann sein, dass ich da was vertüdelt habe?
    Aufe jeden Fall werde ich es einmal rausnehmen und prüfen. Danke für den Hinweis :-) . So wie ich mich kenne, habe ich damit den Bock geschossen.

  20. Wenn ich nicht irre, dann geht die Umleitung von mit www auf ohne (ich habs ja immer anders rum) so:
    RewriteCond %{HTTP_Host} ^www\.intrash\.com$ [NC]
    RewriteRule ^(.*)$ http://intrash.com/$1 [L,R=301]

    Und… gehts ohne das? Ich hab mir mit der htaccess selbst auch schon oft genug nen Bock geschossen, vor allem mit rewrite rules ;-)

  21. @Tanja: Leider war es das auch nicht. Da werde ich wohl doch den Hoster kontaktieren müssen. .htaccwss und robots.txt ohne Erfolg geändert. Auch die Plugins hatte ich schon deaktiviert.
    Der Hund muss woanders begraben sein…

    Die .htaccess lasse ich vorläufig ohne Umleitung. Wenn ich sie wieder reinnehme, wird es aber dein Schnippel sein :-) .

  22. Ist diese “www” Umleitung von dir oder von WP?
    WP macht das nämlich selber auch (wenn man seine Adresse entsprechend angibt in den Einstellungen)… im ersten Fall würde das irgendwie doppelt gemoppelt enden?!

  23. PS: Außerdem will ich wissen, wo du diese schöne Code-Formatierung her hast :-)

  24. Marc hat Recht, ich will die geile Code-Formatierung auch haben ;-)
    Und ja… WordPress macht auch vieles selbst. Aber ich mopple auch doppelt und im Normalfall schadet es auch nicht. Muss aber net drin sein ;-)

    Jetzt muss aber wirklich der Hoster ran. Ich drück Dir die Daumen. Irgendwas beißt sich da irgendwo…

  25. @Marc & Tanja: Gelle, das ist mal ein schönes Plugin. Ich hatte hier schon einige im Einsatz und in irgendeinerweise habe sie immer Probleme bereritet.

    Das für mich ideale war dann CodeColorer. Es ist einfach anzuwenden, aber kommt mit einigen tollen Möglichkeiten daher. Ich kann es nur empfehlen. Da wollte ich auch schon längst ‘nen Beitragg zu geschrieben haben… :-(
    Euch wünsche ich viel Freude daran :mrgreen: .

  26. @Marc: Sorry, jetzt habe ich doch glatt deinen anderen Kommentar übersehen.

    Der erste Eintrag in der .htaccess stammt von mir. Den 2. Block hat WP selbst erstellt.
    Das WP auch einen Eintrag für “ohne www” erstellt, war mir gar nicht bekannt. Wo kann ich das denn einstellen?

  27. WP_HOME und WP_SITEURL korrekt angeben in der wp-config.php – den Rest macht WP dann alleine.

    Alle Angaben ohne Gewähr ;-)

  28. @Marc: Das klingt nach einem coolen Tipp. Dankeschön :-)

  29. Das macht WP auch ohne die Angaben, ich mach es aber auch lieber über rewrite. Aber die Angaben in der wp-config.php sollte man trotzdem machen, das spart DB Last.

  30. @Markus: Last von der DB kann man nie genug wegnehmen. Die Änderungen werde ich auf jeden Fall noch vornehmen.

  31. Das Plugin muss ich mir mal in Ruhe zu Gemüte führen. So was muss auch ohne Plugin gehen ;-)

    Sagst Du Bescheid wenn Du vom Hoster Rückmeldung hast? Würde mich schon sehr interessieren, was das für ein Problem ist…

  32. @Tanja: Wie ich dich kenne, bekommst Du das auch hin :-) .

    Klar gebe ich euch Bescheid. Die Hotline ist leider ständig besetzt. Ich hoffe doch, dass ich da heute noch jemanden an die Strippe bekomme.

  33. @all: Das Problem ist wahrscheinlich gelöst. Im Websniffer ist jetzt alles im grünen Bereich. Das Problem lag nicht am Hoster.

    Es lag an einem php-Schnipsel, den ich noch im Footer hatte. Er gehörte zu einem Plugin, welches ich vor einigen Wochen gelöscht hatte. So ein Schiss… :-(
    Jetzt heißt es abwarten und die Webmastertools im Auge behalten!

  34. Das Plugin habe ich mir heute angesehen und mich dann doch dagegen entschieden. Die Zahlen sind zwar toll, werden aber als table kreiiert. Ohne Plugin gehts so gut wie gar nicht (man müsste haufenweise editieren) und so habe ich mich dann doch für eine ganze einfach CSS Lösung ohne Zahlen entschieden. Die tut es auch ;-)

    PHP Schnipsel im Footer… böse Sache *autsch*. Was sagen die Webmaster Tools? Wirds schon weniger, bzw. werden jetzt endlich Artikel indiziert?

  35. @Tanja: Schade, über eine Lösung ohne Plugin hätten sich bestimmt auch ein paar andere gefreut. Aber über CSS ist wahrscheinlich sogar die schlankere Lösung.

    In den Webmaster Tools hat sich noch nichts verändert. Es wurde noch nichts indiziert, aber es ist auch keine neue Fehlermeldung hinzugekommen. Die letzt Meldung stammt vom 21.04, also 2 Tage vor meiner Änderung. Ich muss mich wohl noch ein wenig in Geduld üben :-( .

  36. Na, das ist doch ein herrlicher Anblick. Das versüßt mir den Sonntag noch etwas mehr :-) .

1 Trackbacks & Pingbacks

  1. Chris D

Kommentar hinterlassen

E-Mail Adresse wird nicht veröffentlicht.

*