информационни технологии за извличане в Интернет

След като учи тази тема, ще се научите и да се повтаря:

- Какви са търсачките;
- Има четири основни части на търсачките;
- какви извличане на информация съществува в интернет;
- Основни правила за заявката в Yandex търсачката.

Bots

огромен брой документи, фокусирани върху интернет. За да направи по-лесно да се намери информация, създаване на специални търсачки.

Търсачките - това автоматично анкети сървъра на системата, свързан с голяма площ мрежа и магазини в своята информационна база данни на разположение на сървъра на базата данни. Според специално създадена двигатели заявка за търсене предоставят информация за това къде да се получи необходимите данни.

информационни технологии за извличане в Интернет

Като общо правило, търсачки се състоят от три части: програма за обработка на робот, индекс и заявка.

♦ обработка на исканията за програма - програма, която, в съответствие с искането на потребител "изглежда" индекс за наличие на необходимата информация, и връща позоваване на документите, намерени. Много препратки към изхода на системата се разпространява програма в низходящ ред на значение за това, че е от най-важните връзки към най-малкия искането.

В момента най-популярни за българските интернет потребители са три големи търсачки индекс тип:

Тези системи вземат предвид граматичните особености на българския език, така че резултатите от търсенето в рускоезичните ресурси на по-високо качество от тези на западните системи.

Търсачките се различават в обхвата на информационни ресурси:

♦ търсачките общообразователните предмети имат база данни от всички области на знанието и различен широк индекс и големия обем на натрупаните информация;
♦ специални търсачки разглеждат само обектите по даден въпрос, като музика или музей.

Основните характеристики на търсачките са:

♦ редица документи в индекса;
♦ информация актуализация честота;
♦ информационно пространство, което включва търсене робот на двигателя, както и разнообразие от видове документи, за които се събират данни;
♦ скорост на преработка на заявка;
♦ значение критерий за определяне (намерено съвпадение документ заявката за търсене);
♦ възможност за подробно и изясняване на искането.

Търсене по търсене категория двигатели

директории за търсене са систематично събиране (събиране на) връзки към други интернет ресурси. Връзки са организирани в тематична позиция, която е йерархична структура, преместване, на която можете да намерите подходяща информация.

Тук като пример структура на директория с интернет търсене Yandex. Това е директория с общо предназначение, тъй като тя съдържа връзки към Интернет ресурси в почти всички възможни посоки. В този каталог отбелязани със следните теми:

♦ Бизнес и икономика;
♦ препратки и връзки;
♦ общество и политика;
♦ дома и семейството;
♦ науката и образованието;
♦ дейности;
♦ Компютри и телекомуникации;
♦ културата и изкуството.

Всяка тема включва редица подраздели, а те, от своя страна, съдържа позиции, и така нататък. Г.

Този метод на търсене е доста бързо и ефективно. В края сте поканени на всичките 5 мача, сред които има линкове към сайтове с песните на известни бардове. Остава само да се намери в архива на сайта с текст Окуджава и изберете желания текст.

информационни технологии за извличане в Интернет

Търсене по ключова дума

Повечето търсачки имат способността да се търси по ключова дума. Това е един от най-често срещаните видове търсене. За да търсите по ключови думи трябва да въведете в специална кутия, дума или няколко думи, които трябва да се търси, и кликнете върху бутона за търсене. Търсачката намира в база данни и показване на своите документи, които съдържат тези думи. Такива документи могат да бъдат много, но много не означава непременно, в този случай е добро.

Ние извършваме няколко експерименти с някоя от търсачките. Да предположим, че ние решихме да има аквариум, и ние се интересуваме от който и да е информация по тази тема.

На пръв поглед най-простите - е търсенето на "аквариум". Проверете го, например, в Yandex търсачката. Резултатът от търсенето ще бъде повече от 460000 страници 3500 сайтове - огромен брой връзки. И, ако се вгледате внимателно, те ще бъдат едно от местата, които споменават групата Б. Grebenshchikov "Аквариум", търговски центрове и неформални сдружения на едно и също име, и толкова повече, не е свързана с аквариумни риби.

Не е трудно да се отгатне, че такова търсене не може да задоволи и смирен потребителя. Прекалено много време ще трябва да похарчите за него, за да изберете измежду всички предложени документи са тези, които ни засягат желания обект, и още повече от факта, че запознаят със съдържанието им.

Можем да заключим, че веднага можете търсите дума, като правило, не е редно, защото една дума е много трудно да се определи една тема, която е посветена на документ, уеб страница или уебсайт. Изключенията са редки думи и термини, които почти никога не се използват извън тяхната тематика.

Нека се опитаме да прецизирате търсенето си и да влезе фразата "аквариумни риби". Резултатът от търсенето ще бъде малко повече от 20 страници и фирмени около 650 места. Както можете да видите, броят на връзките е намалял с повече от 20 пъти. Този резултат ни устройва повече, но все пак сред предлаганите връзки може да се случи, например, българските сувенирни комплекти от етикети мач с изображения на риба, както и колекция от скрийнсейвъри за вашия настолен компютър, каталози със снимки на аквариумни риби, аксесоари аквариум и магазини.

Очевидно е, че ние трябва да продължи да се движи в посока стесняване на търсенето.

За да направите търсенето по-продуктивни във всички търсачките имат специален език за заявки със синтаксис. Тези езици са сходни в много отношения. Разгледайте всички тях е трудно, но всеки търсачката има система за помощ, която ще ви позволи да се научи език.

Ето десет прости правила за формиране на заявка в Yandex търсачката.

1. Ключовите думи в искането трябва да бъдат написани с малки букви (малки). Това ще гарантира, че при търсене на всички ключови думи, а не само тези, които започват с главна буква.

2. Търсене за изчисляване на всички форми на думи, според правилата на българския език, независимо от формата на думите в заявката Ви. Например, ако искането е дал думата "знам", която ще отговаря на условието за търсене, и думата "знам", "знам" и така нататък. Н.

3. За да търсите устойчива фраза трябва да се превърнат думите в кавички, като "Китай".

5. За да се намери в едно изречение думите в заявката си дял пространство или "Приключенски нови" или "priklyuchencheskiyroman". Няколко въведена по думите на заявката, разделени с интервали, означава, че те трябва да бъдат включени в предложението на желания документ.

6. Ако искате да сте избрали само тези документи, които се срещнаха на всяка дума в заявката си, поставени в предната част на всеки един от тях знак плюс "+". Ако, напротив, искам да се изключат някои думи от резултатите от търсенето, да предшества думата минус "-". В "+" и "-" трябва да бъде написана през дупката от предишната и заедно с следващата дума. Например, търсещи "Волга" -кола документи ще бъдат намерени, които съдържат думата "Волга" и няма дума "кола".

7. При търсене на синоними или са свързани по смисъла на думи между думите може да се постави вертикална линия «|». Например, търсене "дете | бебе | бебе "ще бъдат намерени документи с някоя от тези думи.

8. Вместо една дума в заявката, можете да заместите целия израз. За тази цел е необходимо да се предприемат в скоби, като например "(за деца | бебе | деца | Бебешки) +. (Грижа | образование)"

"(Тилда) ви позволява да намерите документи с предложението, съдържаща първата дума, но не включва втори. Например, при поискване "книги

пазаруват "на всички документи, съдържащи думата" книга ", ще бъдат открити, до която (в рамките на изречението) не е думата" магазин ".

10. Ако операторът се повтаря веднъж (например, или

), Търсенето се извършва в рамките на едно изречение. Dual оператор (-) дефинира търсене в документа. Например, търсене "Рак - Астрология", ще бъдат открити документи с думата "рак" не е свързана с астрология.

С определен набор от най-често използваните термини в дясната зона, можете да използвате разширено търсене. Фиг. 3.3 показва разширеното поле за търсене на Yandex търсачката. В този режим, езикови заявка функции се изпълняват във форма. Такава услуга, включително и лексикални филтри, предлагани от почти всички търсачки.

информационни технологии за извличане в Интернет

Фиг. 3.3. Пример за усъвършенствана система за търсене Yandex

С правилна селекция на желани и задължителни думи и изключва нежелани думи, такова търсене, може да даде добри резултати.

Връщайки се към примера на аквариумни риби. След като прочетох няколко предложи търсачката на документи става ясно, че търсенето на информация в интернет не трябва да се започне с избора на аквариумни риби. Аквариум - сложна биологична система, създаването и поддържането на която изисква специализирани знания, време и сериозни инвестиции.

Въз основа на лицето, получил информацията, генериране на търсене в интернет, може драматично да промени стратегията на допълнително търсене, като реши да учи техническа литература, свързана с тестовия обект.

За документите за търсене литература или пълния текст на разположение следната заявка:

След обработка от заявка за търсене на двигателя произведени следния резултат: страница - 195 места - не по-малко от 43.

Както се вижда от статистиката на търсене, резултатът е много успешна. Още от първите връзки водят до необходимите документи:

Сега е възможно да се обобщят резултатите, да се направи някои изводи и да вземе решение за възможни действия:

професионален търсене

За изследователи и специалисти имат повече внимателен подход към изследователски организации. Когато един професионален търсят информация в интернет, трябва да отговарят на следните изисквания:

♦ висока скорост на търсене;
♦ надеждността на получената информация;
♦ пълнота на покритие при търсенето на ресурси.

Speed. Скоростта на търсенето зависи основно от два фактора: търсенето на компетентен планиране (избор на услуги за търсене и инструменти), както и умения за работа с предварително избраната ресурс (способността бързо да се разбере нейната структура и методи за навигация). За да се гарантира, индексите за търсене на скоростта на търсене не е достатъчно. В допълнение към тях в интернет, има редица ресурси за търсене, чието използване осигурява търсенето на специалисти.

Автентичност. Въпросът за надеждността на информацията, получена от интернет, е много подходяща, тъй като всеки може да публикува ли някаква информация, без никакъв контрол на съответствието му с реалността. Това, от своя страна, води до по-голям брой от ненадеждни източници, какви са, например, есета и курсови работи, наводнени в Интернет.

Има специални услуги за търсене, за да се оцени надеждността на източника на информация в Интернет.

Пълнотата. Необходимо условие за успешното събиране пълномащабна на информация е основно познаване на съществуващите към момента видове ресурси и използването на различни услуги за търсене. Не търсачката не може да обхване всички ресурси на Интернет.

Като общо правило, за да се постигне положителен резултат, потребителят трябва да използвате услугите на няколко търсачки. Можете да го направите сами, като се започне от една система на друга и могат да бъдат натоварени с работата на една от системите на Мета (мета - първият компонент на сложни думи, означаващи система за описание и изследване на други системи).

информационни технологии за извличане в Интернет

Фиг. 3.4. Мета системи Windows

Мета двигатели не разполагат със собствени бази данни и търсачките при търсене на ресурси с помощта на различни други търсачки. В резултат на това вероятността за намирането на информация е много висока. Работа metapois- следледников системи, извършени от едни и същи правила, които работят в търсачките. Това се дължи на факта, че Мета двигатели са един вид надстройка на търсачките и да ги използват в работата си индекс на база данни. Мета системи външен вид прилича на външен вид на добре известни търсачки. Фиг. 3.4 е myweb.ru прозорци Мета системи и metabot.ru.

Опитът показва, че в повечето случаи, най-добър резултат се постига чрез използване на множество независими индекси от търсенето, отколкото когато се използва система за мета.

Контролни въпроси и задачи

1. Какво представлява програмата за цел браузър?

2. Какви програми браузъри знаеш?

4. Каква е технологията на търсене от категория търсачка?

5. Каква е технологията на търсене на ключови думи?

6. Какво трябва да се спазват по професионален търсят информация в интернет на изискванията?

7. Когато критериите за търсене трябва да се настрои на "+" или "-"?

8. Какви са критериите за търсене Yandex, определени от следната фраза:

9. Какво е знамението на удвояване (∼∼ или ++) в образуването на комплекс заявка?

10. Какво е значението на търсене?

11. Каква е целта Мета двигатели?