Парс цени, независимо от конкуренти

Парс цени, независимо от конкуренти

В рамките на настоящото преразглеждане ще обмисли как да използвате програмата и как да ги конфигурирате за събиране на цените при анализа или конкуренти.

Най-важното е, че в това, което много от тях са объркани. Не съществува от дълго време няма да съществува парсъри, че може автоматично да събират информация от всеки сайт и автоматично ще го признаят. Невъзможно! И точка. Анализаторът може автоматично да събираме информация от сайта, но това ще бъде само един куп текст, символи и тагове. За да се разделят по някакъв начин полезната информация отделно подчертае името на продукта, цената, достъпност характеристики - изискват индивидуални настройки за определен сайт. Дори и при търсене гиганти като Google и Yandex изисква специална mikrorazmetki на всяка страница, която разказва търсачката, че това е името на продукта, това устройство - описание, но това е - цена. Но как да конфигурирате правилно събиране на необходимата информация - Разберете сега.

Парс цените на конкурентите, използвайки Datacol

Осъществяване на програми ПАРСЕРИ вече, но принципите са едни и същи разбор и да се използва един и същ начин във всички програми. За този преглед, аз избрах Datacol анализатора. защото Познавам го от няколко години и го смятат за най-функционалният от анализатора, което съм учил. Като такъв, тестът няма да бъде, защото изпълнението зависи от настройките са правилни. Цел на статията - да ви запознае с програмата не Datacol, а именно принципите на събиране на информация и разполага с използването на такива програми. Datacol анализатора ви позволява да се изгради почти никаква информация от сайта. Аз често го използвате, за да направи разбор на описанието и характеристиките на стоките, но в тази статия ще се спра на само разбор цена.

Парс цени, независимо от конкуренти
Обозначава началната страница,

Парс цени, независимо от конкуренти
Указва на страницата да се направи разбор

След това уточни данните са пряко кои страници и кои от тях. Сега съм избрал: Citilink код, име на продукта, цената на стоките и URL адрес, който ще е от значение.

И сега най-лошото нещо - необходимо е да се обясни как страницата на програмата, за да намерите точния текст блок и да го съхранява. За да направите това, използвайте инструменти като блокове, XPath, както и регулярни изрази. Какво е това и с какво се хранят извън обхвата на тази статия. Програмата разполага с всички видове помощници и тестери, които са много полезни, за да се създаде. В продължение на много настройки, трябва само да отворите съветника и изберете част от текст, който трябва да бъде Spars.

Парс цени, независимо от конкуренти
Създаване събирането на цените

Desire реи цени Yandex-Market няма почти никакво лидер във всеки онлайн магазин. Сега ние бързо решаване на този проблем, а не само събирането на цените, както и цените за всеки магазин с името им.

Подобно на предишния пример, уточни данните да се събират - името и цената. И се изпълнява.

Само на няколко минути - и да получите на цените на стоките на интереси.

Pars Yandex-пазарни цени по име на продукт

Ние се извърши анализът, чрез случаен подбор на различни продукти

  1. TV BBK 19LEM-1010 / T2C черно
  2. Pram 1 до 3 CHICCO TRIO LOVE розов
  3. Blender Редмънд RHB-2914
  4. Kettle Редмънд RK-G161
  5. Шейвър Philips PT 711/16
  6. Радио будилник Philips AJ3551 / 12
  7. Обектив Nikon 50 mm F / 1.4G AF-S Nikkor
  8. Тир Amtel Planet DC 185/70 R14 88H
  9. Стъкло сапун ястие FBS Ellea лакът 010
  10. Циклене килим Gamma №1 широк

достатъчно имена да вмъкнете в прозореца на програмата.

Парс цени, независимо от конкуренти
Ключови думи

И минута по-късно, вече имаме списък с цени с името на магазина. Свали резултатите от анализирането на заглавията

И ако все още не сте се оказа пълен - Задайте анализатора Yandex-Market според

Веднага очевидни недостатъци разбор по име. Първо - Yandex не винаги дават точни предложения често дава много подобни опции, които могат да бъдат видени ясно във файла за износ. Например, стока "стъкло сапун ястие FBS Ellea лакът 010" от Yandex също беше предложено подобни модели. Второ - за някои стоки, Yandex пазар прав карта предлага стоки, за които необходимостта от отделен анализатора. Необходимо е да се вземат под внимание тези нюанси при търсене на продукти по име.

Но добрата новина. Можете да кликнете върху отстъпката връзка Datacol. и ще получите 10% отстъпка от цената на всеки продукт в платежния. лизинг подновяване.

Първо ще бъдат изброени плюсовете и минусите не е много Datacol програма и независими конкуренти колекция цена.
Плюсове независим разбор:

Против независим разбор:

Що се отнася до самата програма Datacol:

Плюсове Datacol програма:

  • Неограничени възможности за конфигуриране.
  • Голяма част от готови решения и възможност за писане на нови.
  • Скриптове (реализации, кликвания), създаването на приставки.
  • Възможност за поръчка на настройката.
  • Способността да се стартира програмата по график.

Против Datacol програма:

  • Когато разбор голямо количество данни (по-голямо от около 5000 линии), програмата започва да се направи разбор е много по-бавно и дори може да се провалят.

навигация в публикациите