Может быть, немного не в том форуме спрашиваю, но мне нужно прикрутить к OpenCart скрипт, который бы выдирал цены со стороннего сайта (из кода html) по запросу (нажатию кнопки "Обновить цены") из админки. Эти "выдранные" цены должны записываться в отдельную переменную в базе для каждого товара. Страницы, однотипные по структуре html. Пример Html-кода, из которого нужно будет выдирать цену: Код: <div class="price price-highlight"> <del class="original-price">US $ <span class="" id="sku-price">33.00</span> <span class="separator">/</span> <span class="unit"> pair </span> </del> </div> Пока я представляю себе работу этого модуля следующим образом. Большая-пребольшая просьба подсказать, есть ли модули с более-менее похожими функциями, чтобы на их основе можно было написать что-то под свои нужды. И если, вдруг таких нет... как вы думаете большой объём работы придётся проделать, чтобы написать нуля?
Интересная задумка. Я лично для таких целей использую VisualWebRipper. Просто уже настроил шаблоны для парсинга + 30(50) минут работы и готово. Магазин обновил цены.
Такс.. надо посмотреть, что это. У меня просто на днях возникла неучтенная ранее проблема: поставщики начали ацки менять прайсы. Сижу думаю, что с этим делать Если получится что-то путное реализовать через админку по-человечески, поделюсь
В том-то и дело, что у меня универсальная=) Все страницы совершенно однотипные. И я уже в процессе. Осваиваю php... З.Ы. Что-то туго...
А разве у поставщиков нет прайсов в xls? Обычно так и есть, просто... А так, в целом, парсер не сложно написать.
Есть результат? Интересно посмотреть на творение. У нас все гораздо проще для парсинга прайсов конкурентов купили Catalog Downloader, а для анализа и привязки товаров - Инетшоп:
Там нужно не столько про саму библиотеку CURL, сколько про работу с прокси и регулярными выржениями, чтобы вытащить цены со страниц и распарсить новые ссылки для бота. У нас Datacol + Inetshop. Сейчас настраиваем на полную автоматизацию. П.С, с проксями постоянно проблемы мрут как мухи. ЯМаркет еще трудно парсить, банит постоянно.