В предишната публикация за HTML5 определихме как трябва да изглежда структурата на една страница в Интернет, погледната като семантично структуриран HTML документ. В тази публикация ще обясним как трябва да се структурират групи от такива документи, за да могат те да бъдат обходени и индексирани успешно от търсачките.
Адресите на един сайт е препоръчително да съдържат само малките букви от a-z, знаците за тире "-" и наклонена на дясно черта "/". Тоест, страниците трябва да представляват файлове, подредени в директории, както е в една локална файлова система. Търсачките не обичат параметри и се объркват от тях. Параметрите трябва да се избягват максимално.
Може да се използват и адреси на кирилица, но много системи не ги обработват правилно и се губят потенциални входящи връзки. Файловете няма нужда да имат разширения, защото HTTP хедърите предават MIME тип. Но нашия съвет е да слагате разширения на файлове, които са с тип, различен от "text/html". Примерно feed.xml
Нека вземем за пример сайта "http://example.com/". Наклонената черта, с която завършва URL адресът, означава, че се намираме в главната директория на сайта. В UNIX базираните операционни системи това е просто адресът "/". Тук обаче имаме и домейн, който представлява IP адрес.
В главната директория на всеки един сайт може да има две неща - файлове и директории. Примерно адресът "/services" е файл, а адресът "/blog/" е директория. Важно е да се прави разлика между двете. Директориите завършват с наклонена черта, докато файловете не. Директория правим, ако ни се налага да обединим два или повече файла с общ признак.
Ето една семантично подредена структура на сайт (пропускаме протокола и домейна):
/
/services/
/projects/
/about/
/contacts/
/blog/
/blog/category-name/
/blog/category-name/first-blog-post/
/blog/category-name/second-blog-post/
В случая имаме няколко файла (документа) - "services", "projects", "about" и "contact". Имаме и една директория /blog/, която съдържа още документи, представляващи публикации. Логично е потребител да се досети, че на адрес "/blog/category-name/" би следвало да се видят всички публикации от съответната категория. Търсачките също биха го пробвали!
Изводът е, че адресите трябва не само да са логически подредени, но и да работят при изтриване на част от адреса до ниво директория. Ако това не е така, просто се губи смисълът от всичко. Добра практика е всичко да се разглежда като директории, тоест всеки един адрес да завършва с "/". Така структурата може да бъде лесно разширена и да се добавят подстраници на всяка страница.
Идеята за категориите е че при един голям сайт с много страници трябва да има лесен начин ботовете на търсачките само чрез 1-3 препратки да достъпят всяка една страница на сайта. Нивата трябва да са малко, за да може всяка една страница да получи достатъчна доза PageRank. Това ще гарантира нейното влизане в индекса и класиране.
Ако имаме сайт със структура на три нива и ако ограничим връзките от всяко ниво до 100, тогава можем само с две препращания да обходим сайт от 100*100*100 = 1 000 000 страници. Така всяка страница ще е лесно достъпна за потребителите и търсачките. Едва ли на някого ще му се наложи да прави структура за повече от милион страници.
Вече имаме коментари чрез системата DISQUS, така че очакваме Вашите коментари по темата.