07/04/2004
у меня вопрос-раньше сайт был на НТМЛ и как мне кажется лучше индексовался поисковиками-тобишь, находили меня лучше по поисковым словам. А сейчас сайт перевел на РНР. И как мне кажется он хуже воспринимается поисковыми системами. Кто то сталкивался с такой проблемой? и что предпочтительней для поисковиков РНР или SHTML ???
07/04/2004
Юрий, скорее поисковики просто слегка поменяли алгоритм и появились конкуренты.
Из тех, кто обещает не переваривать параметры командной строки по-моему известен только рамблер.
Хотя, на сколько видно из его результатов поиска, он тоже отлично "жует" командную строку.
Из тех, кто обещает не переваривать параметры командной строки по-моему известен только рамблер.
Хотя, на сколько видно из его результатов поиска, он тоже отлично "жует" командную строку.
07/04/2004
Сделайте "прямые" ссылки. Руководство есть, например, здесь: http://sitemaker.ru/technologies/webserver/mod_rewrite/
07/04/2004
с недавних пор Рамблер ПРЕКРАСНО индексит "динамику", здесь, на этом форуме, уже 100 раз это обсуждалось, я было решил переделать сайт под эмуляцию статики, но ВДРУГ и рамблер и апорт и всё остальные стали прекрасно кушать произвольные URL-ы
08/04/2004
Вопрос конечно интересный "а сколько страниц на вашем сате" :)
Я думаю Edward не новичек в сети, но вопрос звучит весьма забавно.
Как можно подсчитать точно, сколько страниц, может быть сгенерировано на динамическом сайте? В зависимости от его структуры и настроек, от 1 до чуть ли не бесконечности.
Реально, количество страниц будет колебаться, в зависимости от изменений например номенклотуры продаваемых товаров и вариантов их описаний, ну и еще раз хочу сказать, от изменений в конфигурации скриптов.
Поэтому, ктоже вам сможет осветить, сколько страниц в динамике, запросит конкретный поисковик? Кстати, разные поисковики могут и запрашивать по-разному и в ответ на их запросы, будет генерироваться соответствующее количество страниц.
Я думаю Edward не новичек в сети, но вопрос звучит весьма забавно.
Как можно подсчитать точно, сколько страниц, может быть сгенерировано на динамическом сайте? В зависимости от его структуры и настроек, от 1 до чуть ли не бесконечности.
Реально, количество страниц будет колебаться, в зависимости от изменений например номенклотуры продаваемых товаров и вариантов их описаний, ну и еще раз хочу сказать, от изменений в конфигурации скриптов.
Поэтому, ктоже вам сможет осветить, сколько страниц в динамике, запросит конкретный поисковик? Кстати, разные поисковики могут и запрашивать по-разному и в ответ на их запросы, будет генерироваться соответствующее количество страниц.
08/04/2004
Вот и подумайте критична ли для вас быстрая индексация новых/обновленных страниц или нет. Если нет, то ради бога, бот будет молотить по сотне раз одни и тежи страницы.
08/04/2004
>бот будет молотить по сотне раз одни и тежи страницы.
- Вот и у меня - до трети трафика сжирают эти боты, и запретить же нельзя - индексация-то нужна (а некоторые так и не слушают robots.txt). И как им сказать, что не чаще 1 раза в месяц для меня достаточно, META-тэги они не хотят исполнять, нужно что-то другое придумывать.
- Вот и у меня - до трети трафика сжирают эти боты, и запретить же нельзя - индексация-то нужна (а некоторые так и не слушают robots.txt). И как им сказать, что не чаще 1 раза в месяц для меня достаточно, META-тэги они не хотят исполнять, нужно что-то другое придумывать.
09/04/2004
на запрос клиента if-modified-since ваш сервер должен отдавать 304 код для старых (неизменненых) страниц. Тогда бот не будет забирать такие страницы, тем самым вы увеличиваете эффективность индексации новых/обновленных страниц. Ну и запрещать доступ неинтересных пауков на сайт. Их много таких. Я как-то засек бота, который принадлежит какому-то штатовскому университету. Из описания понял, что система сделана всего лишь для того, чтобы студенты не так откровенно передирали материалы из сети.
11/04/2004
>Edward
на запрос клиента if-modified-since ваш сервер должен отдавать 304 код для старых (неизменненых) страниц.
- Так речь ведь идет о динамических страницах, т.е. их вообще нет, как таковых, индексируется отклик по cgi-запросу в базу, какая тут дата if-modified-since? А таких страниц может быть сотни и тысячи. Вот как для них указать, что "приходите через месяц или 2 недели, может что-то и поменяется".
Запретить совсем в robots.txt всю папку /cgi-bin/ не хочется - там есть, что индексировать - подробные описания товаров.
на запрос клиента if-modified-since ваш сервер должен отдавать 304 код для старых (неизменненых) страниц.
- Так речь ведь идет о динамических страницах, т.е. их вообще нет, как таковых, индексируется отклик по cgi-запросу в базу, какая тут дата if-modified-since? А таких страниц может быть сотни и тысячи. Вот как для них указать, что "приходите через месяц или 2 недели, может что-то и поменяется".
Запретить совсем в robots.txt всю папку /cgi-bin/ не хочется - там есть, что индексировать - подробные описания товаров.
11/04/2004
при запросе ваш скрипт должен уметь формировать соответсвующий хидер.
Посмотрите RFC 2616
http://www.w3.org/Protocols/rfc2616/rfc2616.html
А конкретная реализация уже зависит от того, на чем вы пишете свои скрипты.
А с метами или robots.txt вариант действительно не пройдет
Посмотрите RFC 2616
http://www.w3.org/Protocols/rfc2616/rfc2616.html
А конкретная реализация уже зависит от того, на чем вы пишете свои скрипты.
А с метами или robots.txt вариант действительно не пройдет
15/04/2004
>А конкретная реализация уже зависит от того, на чем вы пишете свои скрипты.
- Perl. Но разве общение с роботом идет на уровне скрипта?
10.3.5 304 Not Modified :
"the server SHOULD respond with this status code", т.е. сервер должен.
- Perl. Но разве общение с роботом идет на уровне скрипта?
10.3.5 304 Not Modified :
"the server SHOULD respond with this status code", т.е. сервер должен.
Форум закрыт. Написание сообщений ограничено