Поради для всіх
» » Розширений пошук і мова запитів. Мова запитів пошукової системи

Розширений пошук і мова запитів. Мова запитів пошукової системи

Додано: 15.06.16
Автор: admin
Мова запитів – це штучно створена мова програмування, що використовується для того, щоб робити запити в базах даних і інформаційних системах.
Розширений пошук і мова запитів. Мова запитів пошукової системи
В цілому, такі способи запитів класифікувати в залежності від того, призначені вони для бази даних або для пошуку інформації. Різниця в тому, що запити до подібних сервісів здійснюються для отримання фактичних відповідей на поставлені питання, у той час як пошукова система намагається знайти документи, які містять відомості, що відносяться до цікавить користувача області.


Бази даних

Мови запитів до баз даних включають в себе наступні приклади:
  • QL - об'єктно-орієнтований, відноситься до реляційних баз даних; наступник Datalog.
  • Контекстний (CQL) – формальну мову подання запитів для інформаційно-пошукових систем (таких, як веб-індекси або бібліографічні каталоги).
  • CQLF (CODYASYL) – для CODASYL-TYPE баз даних.
  • Концепт-орієнтована мова запитів (COQL) – використовується у відповідних моделях (com). Він заснований на принципах моделювання даних construpt і використовує такі операції, як проекція і де-проекція багатовимірного аналізу, аналітичні операції і висновки.
  • DMX – використовується до моделей інтелектуального аналізу даних.
  • Datalog – це мова запитів до дедуктивних баз даних.
  • Gellish English – це мова, яка може використовуватися для запитів до бази даних Gellish English і дозволяє вести діалоги (запити і відповіді), а також служить для інформаційного моделювання знань.
  • HTSQL – переводить http-запити SQL.
  • ISBL – використовується для PRTV (однією з перших реляційних систем управління базами даних).
  • LDAP – це протокол для запитів і служб каталогів, працюючий за протоколом TCP/IP.
  • MDX – необхідний для баз даних OLAP.
  • Розширений пошук і мова запитів. Мова запитів пошукової системи



    Пошукові системи

    Мова пошукових запитів, в свою чергу, спрямований на знаходження даних в пошукових системах. Він відрізняється тим, що часто запити містять звичайний текст або гіпертекст з додатковим синтаксисом (наприклад, «і»/«або»). Він значно відрізняється від стандартних подібних мов, які регулюються строгими правилами синтаксису команд або містять позиційні параметри.

    Як класифікуються пошукові запити?

    Існує три широкі категорії, які охоплюють більшість пошукових запитів: інформаційна, навігаційна та транзакційна. Хоча ця класифікація не була закріплена теоретично, емпірично вона підтверджена наявністю фактичних запитів у пошукових системах. Інформаційні запити – це ті, які охоплюють широкі теми (наприклад, який-небудь певний місто або модель вантажівок), щодо яких може бути отримано тисячі релевантних результатів. Навігаційні – це запити, які шукають один сайт або веб-сторінку певну тему (наприклад, YouTube).
    Розширений пошук і мова запитів. Мова запитів пошукової системи
    Транзакційні – відображають намір користувача виконати певну дію, наприклад, зробити покупку автомобіля або забронювати квиток. Пошукові системи часто підтримують четвертий тип запиту, який використовується набагато рідше. Це так звані запити підключення, містять звіт про зв'язності проіндексованого веб-графіка (кількість посилань на певний URL, або скільки сторінок проіндексовано з певного домену).

    Як здійснюється пошук інформації?

    Більшість пошукових ресурсів не розкриває свої журнали пошуку, тому інформація про те, що користувачі шукають в Мережі, дуже важко знайти. Проте перші наукові дослідження з'явилися в 1998 році. Пізніше було проведено повторне дослідження в 2001 році, яке проаналізувало запити, які відображаються як високорелевантние. Також стало зрозуміло, як використовується пошуковими роботами мова запитів. Стали відомі цікаві характеристики, що стосуються веб-пошуку: Середня довжина пошукового запиту становила 24 слів.
  • Близько половини користувачів направляли один запит, а трохи менше третини користувачів робили три або більше унікальних запитів один за одним.
  • Майже половина користувачів переглядала тільки перші одну-дві сторінки отриманих результатів.
  • Менше 5% користувачів використовують розширені можливості пошуку (наприклад, вибір яких-небудь певних категорій або пошуку в пошуку).
  • Особливості користувальницьких дій

    Дослідження також показало, що 19% запитів містили географічний термін (наприклад, назви, поштові індекси, географічні об'єкти і т. д.). Ще варто відзначити, що окрім коротких запитів (тобто з декількома умовами), часто були присутні і передбачувані схеми, за якими користувачі змінювали свої пошукові фрази.
    Розширений пошук і мова запитів. Мова запитів пошукової системи
    Також було встановлено, що 33% запитів від одного користувача повторюються, і у 87% випадків юзер буде натискати на той самий результат. Це говорить про те, багато користувачів використовують повторні запити, щоб переглянути або заново знайти інформацію.

    Частотні розподілу запитів

    Крім того, фахівцями було підтверджено, що частотні розподілу запитів відповідають степеневим законом. Тобто невелика частина ключових слів спостерігається в самому великому списку запитів (наприклад, більше 100 млн), і вони найбільш часто використовуються. Інші ж фрази в рамках тих же тематик застосовуються рідше і більш індивідуально. Це явище отримало назву принципу Парето (або «правило 80-20»), і воно дозволило пошуковикам використовувати такі методи оптимізації, як індексування або розділення бази даних, кешування і попереднє завантаження, а також дало можливість вдосконалювати мову запитів пошукової системи.
    В останні роки було виявлено, що середня довжина запитів неухильно зростає з плином часу. Так, середньостатистичний запит англійською мовою став довшим. У зв'язку з цим компанія Google впровадила оновлення під назвою «Колібрі» (у серпні 2013 року), яке здатне обробляти довгі пошукові фрази з непротокольним, «розмовною мовою запиту (на зразок «де найближча кав'ярня?»).
    Розширений пошук і мова запитів. Мова запитів пошукової системи
    Для більш довгих запитів використовується їх обробка – вони розбиваються на фрази, сформульовані стандартною мовою, і виводяться відповіді на різні частини окремо.

    Структуровані запити

    Пошукові системи, що підтримують логічні операції і синтаксис, використовують більш розширені мови запиту. Користувач, який шукає документи, що охоплюють кілька тем або граней, може описувати кожну з них за логічною характеристикою слова. По своїй суті, логічний мова запитів являє собою сукупність певних фраз і знаків пунктуації.

    Що таке розширений пошук?

    Мова запитів «Яндекса» і «Гугла» здатний здійснювати більш вузько направлений пошук при дотриманні певних умов. Розширений пошук може шукати по частині назви сторінки або префікса заголовка, а також у певних категоріях і переліки імен. Він також може обмежити пошук сторінок, що містять певні слова в назві або перебувають у певних тематичних групах. При правильному використанні мови запитів він може обробляти параметри на порядок складніші, ніж поверхневі результати видачі більшості пошукових систем, в тому числі за заданим користувачем словами з перемінним закінченням і схожим написанням. При поданні результатів розширеного пошуку з'явиться посилання на відповідні розділи сторінки.
    Розширений пошук і мова запитів. Мова запитів пошукової системи
    Також це можливість пошуку всіх сторінок, що містять певну фразу, в той час як при стандартному запиті пошукові системи не можуть зупинитися на будь-якій сторінці обговорення. У багатьох випадках мова запитів може привести на будь-яку сторінку, розташовану в теги noindex. У деяких випадках правильно сформований запит дозволяє знайти інформацію, містить ряд спеціальних символів і букв інших алфавітів (китайські ієрогліфи).

    Як читаються символи мови запитів?

    Верхній і нижній регістр, а також деякі діакритичні знаки (умляути та акценти) не враховуються у пошуках. Наприклад, пошук за ключовим словом Citroen не знайде сторінки, що містять слово «Цитроен». Але деякі лігатури відповідають окремих буквах. Наприклад, пошук за словом «аероскобинг» легко знайде сторінки, що містять «Ерескебинг» (АЕ = AE). Багато хто не алфавітно-цифрові символи постійно ігноруються. Наприклад, неможливо знайти інформацію за запитом, що містить рядок |L| (літера між двома вертикальними смугами), незважаючи на те, що цей символ використовується у деяких шаблонах конвертування. Результати будуть тільки дані з «ЛТ». Деякі символи і фрази обробляються по-різному: запит «кредит (Фінанси)» відобразить статті зі словами «кредит» і «фінанси», ігноруючи дужки, навіть якщо і існує стаття з точною назвою «кредит (Фінанси)».
    Розширений пошук і мова запитів. Мова запитів пошукової системи
    Існує безліч функцій, які можна використовувати з застосуванням мови запитів.

    Синтаксис

    Мова запитів «Яндекса» і «Гугла» може використовувати деякі знаки пунктуації для уточнення пошуку. В якості прикладу можна навести фігурні дужки - {{пошук}}. Фраза, вкладена в них, буде піддаватися пошуку цілком, без змін. Фраза в подвійних лапках дозволяє визначитися з об'єктом пошуку. Наприклад, слово в лапках буде розпізнаватися як використовується в переносному значенні або як вигаданий персонаж, без лапок – як інформація більш документального характеру. Крім того, всі основні пошукові системи підтримують символ «-» для логічного «не», а також і/або. Виняток – терміни, які не можуть бути розділені за допомогою префікса дефісом або тире. Неточне відповідність пошукової фрази зазначається символом ~. Наприклад, якщо ви не пам'ятаєте точну формулювання терміна або назви, ви можете вказати її в рядку пошуку з зазначеним символом, і зможете отримати результати, що мають максимальну подібність.

    Параметри спеціалізованого пошуку

    Існують і такі параметри пошуку, як intitle, і incategory. Вони являють собою фільтри, які відображаються через двокрапку, у вигляді «фільтр: рядок запиту». Рядок запиту може містити шуканий термін або фразу, або ж частина або повна назва сторінки. Функція «intitle: запит» віддає пріоритет в пошуковій видачі за назвою, але також показує і звичайні результати за змістом заголовка. Кілька таких фільтрів можуть бути використані одночасно. Як же використовувати цю можливість? Запит виду «intitle: назва аеропорту» видасть всі статті, які містять в заголовку назва аеропорту. Якщо ж сформулювати його як «парковка intitle: назва аеропорту», то ви отримаєте статті з назвою аеропорту в заголовку і з згадкою паркування в тексті. Пошук по фільтру «incategory: Категорія» працює за принципом первісної видачі статей, що належать до певної групи або списком сторінок. Наприклад, пошукової запит за типом «Храми incategory: Історія» буде видавати результати на тему історії храмів. Цю функцію також можна використовувати як розширену, задаючи різні параметри.