подписка
Подписаться
Главная Форум Специальные форумы Архив

Сбор прайс листов из Инета в HTML

Nikolay
02/02/2005
Как то на этом форуме обсуждалась тема о организации площадки аналогичной price.ru

У меня возник технический вопрос похожей направленности.



Задача: Собирать из инета прайс листы различных компаний в формате HTML(не EXEL) и делать из них единый праис лист.



Вопрос: Существует ли готовое решение подобной

задачи или где порыть на эту тему?
Скопировать ссылку на сообщение
Ответить
xy
02/02/2005
man perl

perldoc
Скопировать ссылку на сообщение
Ответить
Сергей
03/02/2005
Скопировать ссылку на сообщение
Ответить
Intel
03/02/2005
Да это вообще нереально, это все вручную делается, где гарантия, что все магазинытовар будут одинаково называть, а ноутбуки вообще нереально с конфигурацией...
Скопировать ссылку на сообщение
Ответить
xy
03/02/2005
to Intel

Вот и выкручиваемся :)

такчто почти реально
Скопировать ссылку на сообщение
Ответить
PriceOk
03/02/2005
С ноутбуками тяжко, с остальной техникой реально
Скопировать ссылку на сообщение
Ответить
helloworld
03/02/2005
Надо попросить их об этом.
Скопировать ссылку на сообщение
Ответить
Vis
06/02/2005
На прайс.ру прайсы отсылают сами фирмы за плату. Там нет единого прайса, все называтся по разному, а делать единый прайс с единым названием очень большая работа. В той фирме где я раньше работал это делали, из многих прайсов делали один, с единым наименованием и можно было сравнить свои цены и цены поставщиков и конкурентов. Технология, у нас это было реализовано в 1С.
Скопировать ссылку на сообщение
Ответить
bornholio
15/02/2005
есть вроде такая штука -граббер. Вот он и тягает с сайтов базы. Пишется индивидуально вроде под каждый магазин, стоит порядка 50 бачей, хотя за опт может скидка выйти...

если интересно могу уточнить -есть у меня вроде знакомый, который етим занимался - у него вродь по всем магазинам есть, думаю договоритесь.
Скопировать ссылку на сообщение
Ответить
tco
15/02/2005
> bornholio

> есть вроде такая штука -граббер

> стоит порядка 50 бачей



ага один спрашивает как типа вроде яндекса смастерить - другой ему да вроде видел где то скрипец за пару баков
Скопировать ссылку на сообщение
Ответить
Константин
15/02/2005
ага один спрашивает как типа вроде яндекса смастерить - другой ему да вроде видел где то скрипец за пару баков

----------

Супер! :)))))))))

За 50 баксов можно граббер написать. Можно даже за 20.

Но он будет грабить 1 (один) фрагмент на 1 (одном) сайте.

Это может быть и весь прайс (если он там и лежит гуськом), или 1 позиция...
Скопировать ссылку на сообщение
Ответить
Nepoyman
16/02/2005
Я могу организовать такой, но стоимость проекта от 5000$, и это при том, что все необходимые исходники есть.



Проблема не в том, чтобы написать прогу, которая по сайту бегает. ПРоблема в админке такого "парсера сайтов". В логике, алгоритмах и т.д.



В обслуживании, наконец. Причем 5К - это весьма оптимистичная оценка.
Скопировать ссылку на сообщение
Ответить
bornholio
16/02/2005
народ -я не проггер, за что купил за то продал... граббер мне предлагали за 50 причем не в одном месте и не только под магазины -вроде и по букмекерским конторам есть... сам впаривать не буду - пишите чего конкретно нать - поспрошаю, а там сами договаривайтесь...
Скопировать ссылку на сообщение
Ответить
avk
16/02/2005
Из своего опыта могу сказать что организация подобного сервиса будет стоить достаточно дорого. Вам однозначно понадобится выделенный сервер, на котором будет работать робот собирающий прайсы. Сервис будет кушать значительный трафик так как он будет вынужден обходить десятки страниц для каждого интернет-магазина - очень мало магазинов у которых весь прайс представлен на одной странице, и не у многих прайсы выложены в excel формате. Что же касается собственно парсинга html то это как здесь уже говорили не проблема. Хотя Ваш парсер скорее всего все равно потребует настройки под конкретный магазин. Проблема с разными названиями товаров в разных магазинах тоже решаема, при соответствующей обработке названий товары могут быть автоматически идентифицированы и связаны друг с другом с приемлемым уровнем ошибок. Но вообще, как здесь уже правильно заметили, подобная система будет представлять собой что-то вроде мини-яндекса. Существуют какие-то коробочные решения наподобии вот этого - http://events.inthepress.ru/v/3726.html , но что они из себя представляют я не в курсе.
Скопировать ссылку на сообщение
Ответить
Евгений
16/02/2005
поддерживаю nepyman и avk :)
Скопировать ссылку на сообщение
Ответить
Форум закрыт. Написание сообщений ограничено
Разделы форума
Открытие бизнеса
Привлечение клиентов
Удержание клиентов
Ведение бизнеса
Работа с маркетплейсами
Тенденции развития
Специальные форумы