W3CHTML jest językiem opisowym używanym do tworzenia statycznych stron Internetowych od 1991 roku. W dzień publikacji oferował 22 unikalne znaczniki zaprojektowane tak, aby w prosty i wygodny sposób móc prezentować informacje tekstowe za pośrednictwem protokołu HTTP. Po 6 latach (1997 rok) opublikowano rozszerzony standard HTML’a w wersji 3.2 oraz 4.0. Język ten szybko stał się ogólnoświatowym standardem określającym sposób tworzenia stron WWW. Wraz z upływem czasu nowe przeglądarki zaczęły implementować ten język w swoich silnikach. Idąc z duchem czasu pojawiły się także „dodatki” do HTML’a takie jak język skryptowy JavaScript, kaskadowe arkusze stylów CSS, czy też animacje flash.

Dwa lata temu organizacja W3C opublikowała nowy, z założenia rewolucyjny standard HTML w wersji 5.0. Poza dodatkowymi znacznikami wprowadza całkowicie nową rzecz – semantykę. Semantyka ma za zadanie stworzyć „inteligentne wyszukiwarki”, które już podczas skanowania kodu źródłowego strony poprzez specjalne roboty do tego zaprogramowane mogłyby przypisać ich zawartość do danych kategorii oraz wydobyć z nich najważniejsze informacje. Zabieg ten znacząco ułatwiłby wyszukiwanie odpowiednich treści oraz pozwolił na „odfiltrowanie” tych mniej potrzebnych jak np. Reklamy. Proces ten wymusza na webmasterze tworzenie bezbłędnego z punktu widzenia walidatora kodu.

Dzisiaj roboty indeksujące treści stron WWW mają problem z odróżnieniem tytułu artykułu, który jak wiadomo odgrywa niebagatelną rolę podczas wyszukiwania cennych informacji, od pozostałej treści, przez co często trudno nam jest znaleźć cenną z naszego punktu widzenia informacje, natrafiając na nic nie znaczące publikacje.

HTML 5 wprowadza kilka nowych znaczników takich jak <section>, <article>, <header>, czy <footer>, które służyłyby właśnie do wyróżniania danych części strony, aby wyszukiwarki mogły je lepiej interpretować.

Bardzo ważną rzeczą w procesie zwiększania inteligencji Sieci jest wygląd stron. Początkowo nie zawracano sobie głowy takimi rzeczami jak „podziałem trój-kolumnowym”, czy osadzaniem filmów video (weźmy pod lupę serwis YouTube) – pliki multimedialne nie były na tyle rozpowszechnione, aby twórcy HTML’a wprowadzali ich obsługę. Dotychczas przeglądarki do ich wyświetlania korzystały z umownego, niewchodzącego w specyfikację HTML’a znacznika <embed>, który wymagał od użytkownika instalacji dodatkowych wtyczek flash. Po pojawieniu się nowego standardu możliwe jest odtwarzanie filmów bezpośrednio po instalacji przeglądarki, dzięki znacznikowi <video>.

Z pozoru wszystko wygląda pięknie i zachęca webmasterów do nauki nowego standardu, lecz istnieje jeszcze druga strona medalu, która ich zniechęca.

HTML 5 wprowadza pewne ograniczenia ze względu na semantykę. Z specyfikacji wyrzucono takie znaczniki jak <font> i <center>, w nowym standardzie do kontroli wyglądu elementów strony musi być stosowany CSS. Ponadto tworzenie szkieletu strony w oparciu o tabele, bądź ramki zostało zabronione. Funkcję tabel przejęły znaczniki <div>, a ramki technologia AJAX.

Dla niektórych, jak i mnie powyższe argumenty nie muszą być na „przeciw piątce”, a wręcz przeciwnie. HTML od samego początku prężnie się rozwijał i podbijał web-rynek. Dziś nie jest on używany tylko i wyłącznie do prezentacji suchej treści, a także do umieszczania galerii, plików multimedialnych, animacji oraz zaawansowanych aplikacji jak WebGadu.

Dlaczego zatem webmasterzy nie porzucą obecnego (x)HTML’a na rzecz „Piątki”? Uważam, że głównym i najważniejszym dla tego powodem jest dostępność implementacji nowego standardu na rynku. I nie mówię tu o zmianie algorytmów takich wyszukiwarek jak Google, ale o czymś znacznie ważniejszym – o przeglądarkach. Obecnie Internet Explorer jest najpopularniejszą przeglądarką Internetową dostępną w Sieci. Korzysta z niej około 60% społeczeństwa. Warto zaznaczyć, że IE będzie obsługiwać nowego HTML’a dopiero od wersji 9.0, a Jak się okazuje 30% całej populacji używa przestarzałych wersji przeglądarek, które nie zapewniają nawet wsparcia dla obecnych standardów.

Reasumując. HTML 4 od 13 lat nie jest w pełni obsługiwany przez obecne przeglądarki, więc i wdrażanie obsługi nowego standardu, mimo płynięcia korzyści z jego stosowania potrwa w optymistycznej wersji kilkanaście lat…

Bibliografia

  • http://pornel.net/html
  • http://pl.wikipedia.org/wiki/HTML5_video
  • http://pl.wikipedia.org/wiki/HTML#Semantyczny_HTML
  • http://pl.wikipedia.org/wiki/Semantyka_%28informatyka%29#Semantyka
  • http://www.kurshtml.boo.pl/html/osadzenie_pliku,multimedia.html
  • http://www.netmarketshare.com/report.aspx?qprid=0&qptimeframe=M&qpsp=139
  • http://gs.statcounter.com/#browser_version-ww-monthly-200908-201008