Podsumowanie 1mld stron
25 stycznia 2006
Kto podjął się takiego trudu? Google. Z wykresów (w formacie SVG) i opisów na stronach podsumowania wynika wiele rzeczy, większości których nie należy się dziwić.

W statystycznych dziewiętnastu różnych elementach obecnych w sieci, królują tabelki oraz znaczniki opisujące wygląd, jak <b/>, <font/>.
Tabelki oczywiście do układu, a nie danych tabelarycznych - <table/>, <tr/>, <td/>. Układy tabelkowe zwłaszcza widać po liście atrybutów - używano głównie tych odpowiadających za wygląd, aby stworzyć gotową do wypełnienia obrazkami makietę. Nie ma powszechnie używanych <th/>, <thead/>, <tbody/>, choć część stron je posiada.
Widać <div/>, ale nie jestem pewny czy były one używane jako sekcje czy pozycjonowane warstwy w programach WYSWIG. Prawie wszystkie przeanalizowane strony miały tytuł.
Wszystkie strony posiadają główny powód dla którego sieć jest siecią - link <a/>. Połowa z nich ma atrybut target, pewnie służący głównie do otwierania w nowym oknie. Także do ramek, jak mniemam (jedyne słuszne moim zdaniem użycie). Wygląda na to, że twórcy hipertekstu używają także atrybutu relacji - głównie nofollow, aby dać do zrozumienia botom wyszukiwarek, że nie życzą sobie przejścia i zindeksowania takiej strony. Reszta wartości jest rozpropagowana przez platformy blogowe czy CMS-y.
Ciekawie wypada top20 nazw klas. Parę z nich, jak small, smalltext można zastąpić znacznikiem <small/>, ostatnio przeze mnie uwielbianym. ;) Według opisu i działan WhatWG elementy o powtarzalnej klasie powinny zostać znacznikami, ale ja nie uważam tego za dobry pomysł.
Zdarzenia, jeśli już użyte, są podpinane do kodu w postaci onmouseover, onclick. Minie dużo czasu zanim ludzi nauczą się używać nieinwazyjnego skryptowania, niestety. Znaczniki meta w kontekście atrybutu name są używane głównie do zaspamowania wyników wyszukiwania. Nie widać Dublin Core.
Generalnie mówiąc zaskoczyło mnie to podsumowanie, biorące pod uwagę semantykę kodu i jego jakość oraz niezrozumienie dla wszelkich powojennych dziwactw. Szczególnie, że jakość kodu stron Google nie jest wzorem, mmo że ostatnio tylko trochę się poprawili.
Link za Papryczkami.


