[Помогите] Парсер товаров ParseMX

Тема в разделе "OpenCart", создана пользователем desing.pro, 19 фев 2013.

  1. cubaseda

    cubaseda

    Регистрация:
    18 авг 2015
    Сообщения:
    9
    Симпатии:
    0
    У меня похоже нет нужного количества постов для того чтобы отправлять сообщения ЛС?
     
  2. Сентинел

    Сентинел

    Регистрация:
    5 мар 2013
    Сообщения:
    239
    Симпатии:
    121
    Ну так скинь здесь ссылку на донора
     
  3. cubaseda

    cubaseda

    Регистрация:
    18 авг 2015
    Сообщения:
    9
    Симпатии:
    0
    http://www.proaudio.ru/ Ещё бы с выводом коротких описаний товаров в категориях разобраться. Добавление в секцию [PRODUCT] строки short_description = tag_html "искомый класс" ничего не даёт........требуемого класса нет на странице товара,он на странице категорий, как по другому,я не знаю. У меня в движке установлен модуль "Short_Description" и соответствующие данные в БД,но не подхватывает в таком варианте.Спросил у автора в теме парсера,он уверяет что это можно сделать,но с дежурным: "Дайте денег(Оплатите лицензию),и типа он пропишет нужное.
     
    Последнее редактирование: 25 авг 2015
  4. Сентинел

    Сентинел

    Регистрация:
    5 мар 2013
    Сообщения:
    239
    Симпатии:
    121
    Это работает на 1.36

    Код:
    [LIST]
    //AUTO LIST START - сгенерировано автоматически
    products = tags_href ".b-products__name-link"
    if (@auto_categorize) categorizer = name . " ". description
    //AUTO LIST END
    
    
    [PRODUCT]
    //AUTO START - сгенерировано автоматически
    pointer = url -> rreplace "[\D]"
    prevcategory = url -> rreplace "[\d]+."
    name = tag_text "h1"
    price = tag_text ".b-products__price-value"
    description = tag_html "p"
    manufacturer = tag_text ".b-products__supplier-value a"
    main_image = tag_image ".container a:nth-child(1) img"
    price => currency
    if (!price and !empty(noprice)) skip = true
    if (@auto_categorize) categorizer = name . " ". description
    //AUTO END
    
    url = prevcategory
    html = url -> get
    StartCommands html
    model = inside "id=""".pointer."""", """ partno" -> replace "nav_id="""
    
    [PASS]
    /* Опции прописаные Мастером Инструкций */
    simple_categories = true
    /**<h2 style='font-weight:normal'>Настройки парсинга</h2>**/
    auto_replace = false // Применять автозамены ко всем страницам
    auto_categorize = false // Автоматически распределять по категориям
    description_images = false // Загружать изображения из описания (Изображения из описания будут загружены к вам на сервер)
    site_language = "" // Язык сайта для перевода (Для автоматического перевода установите язык сайта<br/><b>Например:</b> EN - английский, RU - русский)
    use_yandex_translate = true // Использовать Yandex для перевода (если выключено, будет использоваться полуавтоматический перевод Google)
    noprice = false // Пропускать товары без цены
    update_price = true // Обновлять цену
    update_description = false // Обновлять название и описание
    update_images = false // Обновлять изображения
    update_attributes = true // Обновлять характеристики
    update_options = true // Обновлять опции
    
     
  5. cubaseda

    cubaseda

    Регистрация:
    18 авг 2015
    Сообщения:
    9
    Симпатии:
    0
    Благодарю!!!Но вот незадача,у меня 1.24a ,на уровне слухов........встречал информация что уже есть 1.36 раскодированная,но так и не смог нигде найти.:Unknown: Можно линк откуда взять 1.36? Если можно. С уважением.

    Уважаемый Сентинел! На 1.24a настройки скрипта "не рабочие", парсится категория товаров, а загружается только один. Решаем ли вопрос с версией новее? С уважением.
     
    Lasted edited by : 26 авг 2015
  6. cubaseda

    cubaseda

    Регистрация:
    18 авг 2015
    Сообщения:
    9
    Симпатии:
    0
    Сентинел, ответьте пожалуйста,вывод короткого описания товаров работает на 1.36 или вы имели ввиду только общую настройку для сайта?
     
  7. Сентинел

    Сентинел

    Регистрация:
    5 мар 2013
    Сообщения:
    239
    Симпатии:
    121
    Оно берет описание товара в карточке товара.
    Но можно так же взять и из категории по аналогии с тем как берется модель
     
    cubaseda нравится это.
  8. cubaseda

    cubaseda

    Регистрация:
    18 авг 2015
    Сообщения:
    9
    Симпатии:
    0
    Вот и проявились "подводные камни"...Решил попробовать импортировать товары через CSV Export/Import,верстка едет просто криминально,что делать,не понятно.На дефолтном шаблоне тоже съезжает,почти не заметно,а на моём текущем,просто караул...Кто-нибудь сталкивался с таким,как исправить?
     
  9. Dotrox

    Dotrox Команда форума

    Регистрация:
    27 ноя 2012
    Сообщения:
    2.053
    Симпатии:
    779
    Каким образом вёрстка связана с импортом?
    Если речь идёт об описании товара, правильно экранируйте всё при подготовке файла.
     
  10. cubaseda

    cubaseda

    Регистрация:
    18 авг 2015
    Сообщения:
    9
    Симпатии:
    0
    В файле надо сразу смотреть перед импортом,да?Не у всех товаров косяк с версткой,только у тех в которых в конце лишняя пустая строка.
     
  11. Пытливый

    Пытливый

    Регистрация:
    6 авг 2015
    Сообщения:
    6
    Симпатии:
    0
    Кто может помочь с написанием парсера, готовые парсеры к сожалению настроены на раскрученные проекты. Сколько это будет стоить?
     
  12. Анатолий1115

    Анатолий1115

    Регистрация:
    6 окт 2013
    Сообщения:
    166
    Симпатии:
    8
    Пытливый и Pelmen2 нравится это.
  13. Stealth421

    Stealth421

    Регистрация:
    10 дек 2013
    Сообщения:
    108
    Симпатии:
    53
    как подгружать ajax страницы ктото может признаться?
     
  14. Laon

    Laon

    Регистрация:
    11 окт 2015
    Сообщения:
    2
    Симпатии:
    1
    Подскажите как добавить пробел?
    Код:
    opts_values = insides "№", "</d"
    с донора получаю слитно код (2-4 цифры) и название. Есть возможность их разделить?

    Поторопился с вопросом.
    Решил заменой тега br на пробел, благо он был в коде.
    А вообще сама функция поддерживает регулярные выражения.
    Код:
    opts_values = rreplace "<br />", " ", opts_values
     
    Lasted edited by : 20 окт 2015
  15. svitlo

    svitlo

    Регистрация:
    17 фев 2013
    Сообщения:
    95
    Симпатии:
    13
    Помогите пожалуйста разобраться ... http://www.maktex.ru/e-store/index.php?SECTION_ID=213 вот донор - нужная категория, парсер парсит только 72 товара ... столько сколько доступно на первых 5 страницах которые видны визуально... но вот
    nextpage = tag_href "#new_product a:nth-child(3)"
    инструкция ... однако при переходе на следующую 6 страницу меняется цифра
    nextpage = tag_href "#new_product a:nth-child(8)" с 3 на 8! как мне прописать эту переменную что бы парсер парсил дальше не ограничиваясь этой цифрой?
    И еще не парсит цены((
     
    Последнее редактирование: 31 янв 2016
  16. Dotrox

    Dotrox Команда форума

    Регистрация:
    27 ноя 2012
    Сообщения:
    2.053
    Симпатии:
    779
    Очень странный селектор. Если там должна парсится ссылка на следующую страницу, то должно быть достаточно и так:
    Код:
    "#new_product a.modern-page-next"
    И будет работать для всех страниц.
     
  17. svitlo

    svitlo

    Регистрация:
    17 фев 2013
    Сообщения:
    95
    Симпатии:
    13
    попробовал - не сработало((
    к тому же парсит описание и название в общим весь текст в кракозябрах как я понял кодировка 1251 и донорский сайт на битрикс
    в принципе то кодировка не страшно можно будет сиправить через экспорт импорт но вот цены... и следующие страници ... вот это проблема
     
  18. Fiable

    Fiable

    Регистрация:
    16 авг 2014
    Сообщения:
    171
    Симпатии:
    107
    #new_product a:nth-child(3) это селектор html для выделение первых элементов(Вы типа захватили селектор класса элемента нумерации), а вам нужен перебор ссылок переходов на страницы, по поводу кодировки то укажите ее в .htaccess пропишите.

    AddDefaultCharset UTF-8
     
    svitlo нравится это.
  19. svitlo

    svitlo

    Регистрация:
    17 фев 2013
    Сообщения:
    95
    Симпатии:
    13
    кодировка на серваке и стоит ютф - 8 с др сайтов парсит нормально а с этого гонит кракозябры...
    что касаеться перебора - где его взять? как его определить? то что стоит сейчас автоматически подставила система когда я выделил ссылку на след страницу!
     
  20. Fiable

    Fiable

    Регистрация:
    16 авг 2014
    Сообщения:
    171
    Симпатии:
    107
    Я бы посоветовал, то что там стоит это хорошо, но лучше когда ты сам все прописываешь, может сама база данных не ту кодировку выдать, а по поводу нумерации, то вручную постарайся прописать, и какая версия парсера стоит?