Category Archive
The following is a list of all entries from the XML category. Noteworthy entries are filed topmost.
RSS feeds maken met PHP
Zelf RSS feeds maken is op zich niet zo moeilijk, maar het is lastig om je daarbij precies aan de standaard te houden. Gelukkig is daar RSSCreator, een PHP class die je het leven een stuk gemakkelijker maakt. Of het nu RSS versie 0.91, 1.0 of 2.0 moet zijn, deze class kan het allemaal.
Google Sitemap Test #3
Voor de mensen die het de afgelopen tijd gevolgd hebben: het Google Sitemaps experiment lijkt niet echt geslaagd te zijn. Googlebot heeft het na de eerste veelbelovende 24 uur geheel af laten weten. Er zijn inmiddels wel 2 pagina’s opgenomen in Google, namelijk de homepagina en de sitemap zelf, maar daar blijft het voorlopig bij. In totaal zijn er sinds vrijdag 14 van de ca. 250 pagina’s doorlopen. De XML file wordt overigens wel trouw elke dag gedownload door Google.
Het mag duidelijk zijn dat het aanmelden van een XML sitemap bij Google geen noemenswaardige voordelen heeft. Wellicht dat het in de toekomst gaat veranderen, het is tenslotte ook van Google’s kant een experiment, maar voorlopig kan men net zo goed op de oude manier URL’s toevoegen aan Google.
Google Sitemap Test #2
13 uur nadat ik de sitemap voor Real Turkey heb aangemeld is Googlebot al langs gekomen. Nu had ik gister in het artikel natuurlijk geen link naar de site moeten zetten. Nu kan het ook zo zijn dat Googlebot via deze weblog op de site is gekomen. 13 uur lijkt me echter wel zeer snel voor een eerste bezoek. De eerste elf pagina’s zijn in ieder geval al doorlopen, over een tijdspanne van 3 uur. Ik ben benieuwd hoe lang het duurt voordat de gehele website is opgenomen in Google.
Google Sitemaps
Google heeft weer een proefballonetje opgelaten. Dit bericht bereikte me gisteravond via Google Blog:
We’re undertaking an experiment called Google Sitemaps
that will either fail miserably, or succeed beyond our wildest dreams,
in making the web better for webmasters and users alike. It’s a beta
“ecosystem” that may help webmasters with two current challenges:
keeping Google informed about all of your new web pages or updates, and
increasing the coverage of your web pages in the Google index.Initially,
we plan to use the URL information webmasters supply to further improve
the coverage and freshness of our index. Over time that will lead to
our doing an even better job of delivering more search results from
more websites. (Danny Sullivan interviewed me about this if you want to
read more.)This project doesn’t just pertain to Google, either: we’re releasing it under the Attribution/Share Alike Creative Commons license
so that other search engines can do a better job as well. Eventually we
hope this will be supported natively in webservers (e.g. Apache, Lotus
Notes, IIS). But to get you started, we offer Sitemap Generator, an open source client in Python to compute sitemaps for a few common use cases. Give it a whirl and give us your feedback.
Let op: Het gaat hierbij om een sitemap in een door Google definieerd XML formaat en dus niet om gewone HTML pagina’s. Dit lijkt een erg goede manier om een website in één keer op te nemen in de zoekmachines, zonder dat Googlebot pauzes neemt van enkele dagen.
Na 6 uur (!) was er overigens al code die een dergelijke Sitemap genereert voor Wordpress blogs (via Social Patterns). Ik heb meteen de proef op de som genomen en voila, hier is mijn Google Sitemap.
Toevallig heb ik net een compleet nieuwe website in de pen die vanmiddag live moet gaan, met enkele honderden pagina’s en een vrij diepe link structuur. Dit lijkt mij een mooie gelegenheid om te testen hoe snel een dergelijke website wordt opgenomen in Google als er een XML Sitemap beschikbaar is. Ik zal mijn bevindingen natuurlijk op dit weblog plaatsen!
Update:
Ook voor Movable Type is inmiddels code beschikbaar.
Update 2:
Blijkbaar kun je ook een lijst met URL’s in .txt formaat creëren, met op elke regel een andere URL.
Internet 2.0
We gaan langzaam maar zeker richting ‘Internet 2.0′. De tijd dat een website alleen maar statisch was als het alleen uit HTML code bestond of dynamisch was ‘als er een database achter hing’ is allang voorbij. Een nieuwe generatie van websites meldt zich. Websites die verbonden zijn met andere websites via Web Services en RSS of Atom feeds, die via een combinatie van Javascript en XML een ervaring geven waar MacroMedia’s flash niet aan kan tippen en die allemaal erg bruikbaar (zouden kunnen) zijn. Tenminste, zolang ze niet ten onder gaan in een oerwoud aan advertenties.
Een paar websites die je in de gaten moet houden:

