Semantyczny HTML – przyszłość, czy wybryk W3C?

W3CHTML jest językiem opisowym używanym do tworzenia statycznych stron Internetowych od 1991 roku. W dzień publikacji oferował 22 unikalne znaczniki zaprojektowane tak, aby w prosty i wygodny sposób móc prezentować informacje tekstowe za pośrednictwem protokołu HTTP. Po 6 latach (1997 rok) opublikowano rozszerzony standard HTML’a w wersji 3.2 oraz 4.0. Język ten szybko stał się ogólnoświatowym standardem określającym sposób tworzenia stron WWW. Wraz z upływem czasu nowe przeglądarki zaczęły implementować ten język w swoich silnikach. Idąc z duchem czasu pojawiły się także „dodatki” do HTML’a takie jak język skryptowy JavaScript, kaskadowe arkusze stylów CSS, czy też animacje flash.

Dwa lata temu organizacja W3C opublikowała nowy, z założenia rewolucyjny standard HTML w wersji 5.0. Poza dodatkowymi znacznikami wprowadza całkowicie nową rzecz – semantykę. Semantyka ma za zadanie stworzyć „inteligentne wyszukiwarki”, które już podczas skanowania kodu źródłowego strony poprzez specjalne roboty do tego zaprogramowane mogłyby przypisać ich zawartość do danych kategorii oraz wydobyć z nich najważniejsze informacje. Zabieg ten znacząco ułatwiłby wyszukiwanie odpowiednich treści oraz pozwolił na „odfiltrowanie” tych mniej potrzebnych jak np. Reklamy. Proces ten wymusza na webmasterze tworzenie bezbłędnego z punktu widzenia walidatora kodu.

Dzisiaj roboty indeksujące treści stron WWW mają problem z odróżnieniem tytułu artykułu, który jak wiadomo odgrywa niebagatelną rolę podczas wyszukiwania cennych informacji, od pozostałej treści, przez co często trudno nam jest znaleźć cenną z naszego punktu widzenia informacje, natrafiając na nic nie znaczące publikacje.

HTML 5 wprowadza kilka nowych znaczników takich jak <section>, <article>, <header>, czy <footer>, które służyłyby właśnie do wyróżniania danych części strony, aby wyszukiwarki mogły je lepiej interpretować.

Bardzo ważną rzeczą w procesie zwiększania inteligencji Sieci jest wygląd stron. Początkowo nie zawracano sobie głowy takimi rzeczami jak „podziałem trój-kolumnowym”, czy osadzaniem filmów video (weźmy pod lupę serwis YouTube) – pliki multimedialne nie były na tyle rozpowszechnione, aby twórcy HTML’a wprowadzali ich obsługę. Dotychczas przeglądarki do ich wyświetlania korzystały z umownego, niewchodzącego w specyfikację HTML’a znacznika <embed>, który wymagał od użytkownika instalacji dodatkowych wtyczek flash. Po pojawieniu się nowego standardu możliwe jest odtwarzanie filmów bezpośrednio po instalacji przeglądarki, dzięki znacznikowi <video>.

Z pozoru wszystko wygląda pięknie i zachęca webmasterów do nauki nowego standardu, lecz istnieje jeszcze druga strona medalu, która ich zniechęca.

HTML 5 wprowadza pewne ograniczenia ze względu na semantykę. Z specyfikacji wyrzucono takie znaczniki jak <font> i <center>, w nowym standardzie do kontroli wyglądu elementów strony musi być stosowany CSS. Ponadto tworzenie szkieletu strony w oparciu o tabele, bądź ramki zostało zabronione. Funkcję tabel przejęły znaczniki <div>, a ramki technologia AJAX.

Dla niektórych, jak i mnie powyższe argumenty nie muszą być na „przeciw piątce”, a wręcz przeciwnie. HTML od samego początku prężnie się rozwijał i podbijał web-rynek. Dziś nie jest on używany tylko i wyłącznie do prezentacji suchej treści, a także do umieszczania galerii, plików multimedialnych, animacji oraz zaawansowanych aplikacji jak WebGadu.

Dlaczego zatem webmasterzy nie porzucą obecnego (x)HTML’a na rzecz „Piątki”? Uważam, że głównym i najważniejszym dla tego powodem jest dostępność implementacji nowego standardu na rynku. I nie mówię tu o zmianie algorytmów takich wyszukiwarek jak Google, ale o czymś znacznie ważniejszym – o przeglądarkach. Obecnie Internet Explorer jest najpopularniejszą przeglądarką Internetową dostępną w Sieci. Korzysta z niej około 60% społeczeństwa. Warto zaznaczyć, że IE będzie obsługiwać nowego HTML’a dopiero od wersji 9.0, a Jak się okazuje 30% całej populacji używa przestarzałych wersji przeglądarek, które nie zapewniają nawet wsparcia dla obecnych standardów.

Reasumując. HTML 4 od 13 lat nie jest w pełni obsługiwany przez obecne przeglądarki, więc i wdrażanie obsługi nowego standardu, mimo płynięcia korzyści z jego stosowania potrwa w optymistycznej wersji kilkanaście lat…

Bibliografia

  • http://pornel.net/html
  • http://pl.wikipedia.org/wiki/HTML5_video
  • http://pl.wikipedia.org/wiki/HTML#Semantyczny_HTML
  • http://pl.wikipedia.org/wiki/Semantyka_%28informatyka%29#Semantyka
  • http://www.kurshtml.boo.pl/html/osadzenie_pliku,multimedia.html
  • http://www.netmarketshare.com/report.aspx?qprid=0&qptimeframe=M&qpsp=139
  • http://gs.statcounter.com/#browser_version-ww-monthly-200908-201008

3 thoughts on “Semantyczny HTML – przyszłość, czy wybryk W3C?

  1. Rzeczywiście przystosowanie się do piątki zajęłoby kilkanaście lat w normalnym tempie, ale co z udziałem własnym (webmasterów)? Gdyby każdy z nas zainstalował najbliższym najnowsze wersje przeglądarek i kazał to przekazywać (po 500 znajomych na fb)? W końcu statystycznie każdego z nas z innym człowiekiem na świecie łączy 8 ludzi…

  2. Nie każdy byłby skłonny z przejściem na nowe przeglądarki, gdyż jak zakładam kilkadziesiąt (może kilkanaście) procent ludzi posiada jeszcze system Windows XP (który de facto nie jest już wpierany przez Microdoft), na którym preinstalowana jest stara wersja IE, a jak wiadomo nie wszystkim chce się instalować inną.

    Z drugiej strony twórcy przeglądarek także muszę wziąć się do roboty i implementować nowy język do swoich silników.

    Dodam jeszcze, ze my – webmasterzy – nie jesteśmy, aż tak do tyłu i piszemy strony zgodnie z standardem HTML 4.01, bądź (x)HTML 1.1, nie licząc sporadycznych przypadków, od których pewnie Internet nigdy się nie uwolni 😉

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *