подписка
Подписаться
Главная Форум Специальные форумы Архив

Сбор прайс листов из Инета в HTML

LL
16/02/2005
Бред всё это - делать парсер HTML для каждого сайта!Я в своё время наслушался подобных идей.



Делать надо через XML.



Что не на всех сайтах экспорт в виде XML предусмотрен?На нормальных сайтах он есть или его сдалют по вашему запросу(им самим это выгодно).А на плохие сайты и расчитывать ненадо они очень быстро загибаються.



Ну и каталог товаров как яндекс маркет.



Вот и всё.
Скопировать ссылку на сообщение
Ответить
Грибо
16/02/2005
посмотрите priceok.ru там движок сам цены собирает...
Скопировать ссылку на сообщение
Ответить
avk
16/02/2005
2LL

Все зависит от того какие цели вы преследуете. Если Вы хотите сделать каталог с выборкой товаров и цен из пары сотен магазинов, то XML самое то. Если же преследуется цель предоставить пользователю как можно более полную информацию о ценах и продаваемых товарах, Вам придется делать полноценную поисковую систему и собирать информацию и с тех ресурсов, которые не имеют прайсов в форме, пригодной для непосредственной закачки в базу. И таких ресурсов очень много. И если Ваш каталог будет их игнорировать то IMHO для пользоателя ценность его будет невелика.



В качестве хорошего примера поисковой системы по товарам можно посмотреть на сервис www.bizrate.com. Если верить их утверждениям они собирают прайсы с магазинов независимо от их желания предоставлять прайс или нет. На данный момент они утверждают что у их базе 54 тысячи магазинов (http://www.bizrate.com/ratings_guide/guide.html). К сожалению в рунете подобных ресурсов пока нет.
Скопировать ссылку на сообщение
Ответить
Виктория Сергеева
16/02/2005
*поддерживает LL*

=)
Скопировать ссылку на сообщение
Ответить
Константин
16/02/2005
ЛЛ, так то оно так. Но это проходит тогда, когда все белые и пушистые.

А если ты проводишь "грабеж" БЕЗ его ведома (ну типа показать, как МЫ недорого продает, и какие все остальные кАзлы) - то ваши не пляшут.

Поэтому решение зилино зависит от постановки задачи. Делать 137-й Я-маркет или присе-ру, или реальный объективный анализатор, который не вмешивается в процесс.

Потому что в Я-М - сделанные для него прайсы в хмл сильно далики от реальных положений дел.
Скопировать ссылку на сообщение
Ответить
Виктория Сергеева
16/02/2005
Константин, а никто и не спорит что дело в постановке =)

С неё вообще-то все и начинается. Это я Вам как системный аналитик системному аналитику ;)
Скопировать ссылку на сообщение
Ответить
Виктория Сергеева
16/02/2005
Константин, если это (к примеру) прайс-лист, выложенный в доступное место для скачивания всем желающим, то при условии не изменения данных в прайс-листе использовать Вы его можете как угодно. Это открытая информация.

Провести аналитический обзор по открытой информации никто никогда запретить не сможет. Пляшут и Ваши и наши =)



ps: Есть какая-нибудь тема на этом форуме в которой мы с Вами придем к единому мнению? ;)
Скопировать ссылку на сообщение
Ответить
tco
16/02/2005
avk очень точно все описал
Скопировать ссылку на сообщение
Ответить
Константин
16/02/2005
Вика, так никакого расхождения и нет (во мнениях).

бучу затеялм вообще-то с прицелом "а можно ли так вообще делать?"(в принципе) - сгребать прайсы без из предварительной подготовки?

Ответ: мона, тока долого стоить будета, однака...



тут выскакивает умник, и кричит - в иксемеле надо! Спасибо, гуру! наставил на путь истиный! а мы ж, дураки, колесу молимся...

Фенька то в том, что ИМ как работал - так и работает и не парится хмл-ом...
Скопировать ссылку на сообщение
Ответить
LL
17/02/2005
>Делать 137-й Я-маркет или присе-ру, или реальный объективный анализатор, который не вмешивается в процесс.



Объективный анализатор? То есть вы хотите сказать что собирая информацию с этих страниц вы добьетесь объективности? Сомневаюсь, как было по телефону "извините у нас ваш товар закончился, возьмите вот этот" так оно и останется.



>Фенька то в том, что ИМ как работал - так и работает и не парится хмл-ом...



Ага ИМ не парится XML-ем, зато разработчик париться HTML-ем. Для каждого ИМ.





Хотя впринципе согласен - возможно все. Только вот вопрос надо ли?



Как в анекдоте :

-А у нас зубы через зад вырывают!

-?!

-А у нас всё через зад делают!
Скопировать ссылку на сообщение
Ответить
Константин
17/02/2005
" "извините у нас ваш товар закончился, возьмите вот этот" так оно и останется."

Вот если это делать в хмл-е, по договоренности с ИМ - именно так оно и будет.

Поэтому реально объективный анализатор цен надо делать в хтмл-е и брать не прайсы, а из описаний товаров, там где "положите в корзину". Т.ч. на "для каждого сайта", а для "каждой позиции".

Да, тяжко. Но кто сказал, что будет легко? :)



Тут где то пост был, что этот граббер забанить можно. Можно, но кому от этого хуже будет? :) С таким же успехом можешь на входной двери замок повесить.
Скопировать ссылку на сообщение
Ответить
Виктория Сергеева
17/02/2005
ыыы... если народу интересно то расскажу как покупала неделю назад себе компьютер через ИМ

=)
Скопировать ссылку на сообщение
Ответить
Константин
17/02/2005
Интересно. Можешь и у меня продублировать. там народ такие рассказки любит...
Скопировать ссылку на сообщение
Ответить
Виктория Сергеева
17/02/2005
ну в общем-то ситуация стандартная - заказывала одну машинку - просидела на их сайте минут сорок - все подобрала, посчитала, счет прислали на другую (изменили материнскую плату и жесткий диск, мышь вместо черной поклали белую и т.д. цена была та же - хоть это радует), - сказали приезжайте, забирайте - мышь нашли, косяки поправили

плату откопали



Пришла забирать - нет такой - начали опять собирать эту бедную машинку (на компьютере менеджера отдела по их каталогу), пол-часа простояла на ресепшене пока мне распечатали счет и спецификацию, это был четвертый вариант. Тут меня уже начало немного потрясывать, хоть я в общем-то человек очень спокойный.

Через три минуты выяснилось что _похожая_ машина есть, но в белом корпусе и не та материнская плата какую я хотела.



Я уже была готова даже на зеленый в горошек корпус и какую угодно мать - время 7 часов вечера, в 2 ночи нужно отослать модель.



Давайте, говорю в белом! И эта убийственная фраза: а он в жарочном шкафу стоит - мы ведь российский бренд вам продаем - тестирование.

- А я вас просила? Отдайте мне мой системный блок хоть тушкой хоть чучелом!

- если мы вам его сейчас отдадим то гарантия будет не 12 месяцев а 6!

- да мне на@#$%ть на эту гарантию, вы мне блок отдайте?



Молодой человек уже рисковал остаться без глаз - даже очки бы ему не помогли. Есть еще одна, говорит, но она на эпоксе. У меня уже слезы наворачиваются: я на ней и хотела. Я уже не знаю над кем издевалась - над ним или собой - спрашиваю - А что же вы её в жарочный шкаф не засунули?

А мы на эпоксе не засовываем - они этих шкафов не любят и дохнут



Не помню как я вылетела из этого магазина, перешла через дорогу, зашла в другой и через 16 минут везла домой черный системный блок с моей "любимой" платой



Следующий мой компьютер будет мак. Это однозначно.
Скопировать ссылку на сообщение
Ответить
Константин
17/02/2005
Следующий мой компьютер будет мак. Это однозначно.

--------------

:):):)

А вот горячку пороть не надо... :)
Скопировать ссылку на сообщение
Ответить
Форум закрыт. Написание сообщений ограничено
Разделы форума
Открытие бизнеса
Привлечение клиентов
Удержание клиентов
Ведение бизнеса
Работа с маркетплейсами
Тенденции развития
Специальные форумы